眼下,大模型正推动智能算力需求爆发式增长。
但智能算力很贵,除了互联网大厂等极个别企业有能力自建智算平台外,大多数中小企业目前还是依赖于购买或租用算力,其本钱也并不低。
这成为了中小企业狂奔大模型赛道的痛点和堵点。
北京“算力券”的推出,将有望打通这一堵点,为家当打开全新的想象空间。

算力有望打五折

就北京方案出台“算力券”政策,北京市经信局干系卖力人在接管北京商报采访时先容,目前“算力券”政策正在研究中,详细细节还未敲定。
不过,可以明确的是,“算力券”中算力的供应方来自北京经信局正在征集的“北京市通用人工智能家当创新伙伴操持”成员。

北京商报在北京市经信局官网查询创造,7月3日,北京市经信局已经发布了第二批伙伴名单,63家伙伴企业中,算力伙伴10家,分别为北京百度网讯科技有限公司、北京世纪互联宽带数据中央有限公司、中国电信株式会社北京分公司、中国移动通信集团北京有限公司、北京昇腾创新人工智能科技中央有限公司、京东科技信息技能有限公司、北京红山信息科技研究院有限公司、企商在线(北京)数据技能株式会社、北京神州数码云科信息技能有限公司、北京金山云网络技能有限公司。

租用AI算力价格贵未来北京有望给你打五折

此前发布的第一批伙伴成员中,共有算力伙伴2家,分别为阿里云打算有限公司和北京超级云打算中央。

关于算力券的详细价格,前述北京经信局干系卖力人表示正在研究中。
不过,他也指出,目前算力伙伴供应的算力价格尚未公布,但基本已经是市场价格的五、六折旁边。

算力租赁的市场价格是若何的?供应算力做事的北京昇腾创新人工智能科技中央有限公司CTO杨光见告北京商报,目前市场价格约为15-20元/卡/时,1P大约是3-4张卡。
“‘卡’指单芯片,目前算力价格确实也不是很统一。
但这个价格对付中小企业来说还是比较昂贵的,以是急需有普惠算力支持企业发展。

杨光举例,一个常规的AIGC项目租用的算力规模涉及到的“点”比较多,用度并不太随意马虎进行统一打算,“但是有公开数据显示,演习一个GPT-3须要花费460万美元”。

此前有称,国际算力设备龙头企业英伟达也操持开放DGX Cloud实例,企业可以“云租赁”的形式按月租用DGX Cloud集群,价格为每实例3.7万美元/月起。
DGX Cloud能为AI超级打算供应完全的办理方案,借助该集群,企业用户可扩展大型多节点演习事情负载的开拓,无须等待需求量常日很大的加速打算资源。

“出台‘算力券’政策,紧张是为理解决中小大模型企业算力本钱问题,支持基于落地运用处景的中小企业获取多元化、低本钱优质算力。
”前述北京经信局干系卖力人表示,“如果企业有须要,我们很乐意供应算力供需对接的平台。

需求暴增推高算力价格

本次北京经信局方案“算力券”的背后,是呈现爆发式增长的智能算力需求。

随着ChatGPT在今年的爆火,各大科技企业都开始逐鹿细分行业大模型,包括但不限于交通、医疗、数字政务等细分领域。
根据北京市经信局在人工智能论坛上表露的数据,我国目前已有80余个大模型公开拓布,个中北京约占一半。
“但除了大型互联网企业、AI龙头企业具有较多的GPU算力芯片储备外,中小企业在发展AI模型、运用过程中,遭遇算力瓶颈。

一家科技企业卖力人王楠见告北京商报,他们公司紧张通过向大厂购买算力来办理算力需求,而ChatGPT在今年溘然崛起,许多大厂的GPU算力芯片价格都涨了不少,一段韶光里乃至高价也很难买到。

算力本钱涨了多少,从英伟达GPU芯片的交付价格即可一窥。
目前,AI算力中最关键的芯片GPU被英伟达垄断,市场霸占率达到90%以上。
以英伟达GPU芯片A100为例,该芯片价格从去年12月开始上涨,截至今年4月上半月,其5个月价格累计涨幅达到37.5%;同期A800价格累计涨幅达20%。
同时,英伟达GPU交货周期也被拉长,之前拿货周期大约为一个月,现在基本都须要三个月或更长。
乃至,部分新订单“可能要到12月才能交付”。

北京商报查询后理解到,一张40G显存的A100芯片,在电商平台上所标售价达6.25万元。
因此,A100芯片也一贯被广大科技发热友戏称为“小金砖”。

这也导致了自建智能算力平台本钱极高。
今年5月,上海张江一家数据公司的干系卖力人在接管媒体采访时曾表示,“一台包含8张A800的DGX超算,现在市情上的价格可能要到230万元到250万元之间,价格还在持续上涨。

而算力的需求究竟有多大?资料显示,OpenAI为了演习ChatGPT,构建了由近3万张英伟达V100显卡组成的弘大算力集群,GPT-4更是达到了100万亿的参数规模,其对应的算力需求同频年夜幅增加。
如今海内多家企业宣告投身大模型的公司,如果再叠加打算上环绕大模型的人工智能生态和由此产生的用于推理的算力需求,未来的算力缺口将更加惊人。

“总体上看,我国的算力需求从静态来说目前‘基本’能够实现算力供需之间的平衡,但是从动态角度来说,未来越来越多的行业、企业要利用大模型、利用人工智能多模态,算力在未来存在非常大的缺口。
”北京社科院研究员、中国公民大学智能社会管理研究中央研究员王鹏在接管北京商报采访时表示。

加大算力供给是根本

弘大的算力需求为AI算力家当带来了广阔的市场空间。
来自IDC的数据与预测显示,2021年中国智能算力规模达到155.2EFLOPS(每秒一百亿亿次的浮点运算)并在之后的几年始终保持稳健增长态势,估量到2026年将打破进入每秒十万亿亿次浮点打算级别,智能算力实现1271.4EFLOPS的弘大规模,2021-2026年期间,估量年复合增长率达到52.3%。

各科技巨子在算力上的投入也十分明显。
在百度2023年Q1财报中,其AI的内容贯穿始终。
腾讯发布的2023年Q1财报中,在数实经济、广告和游戏三大核心业务集体发力下,腾讯重回增长曲线。
值得一提的是,关于算力和人工智能的部分,同样霸占了财报很大的篇幅。

但算力本钱高,成为了制约企业的一道坎,特殊是对中小企业而言。
而算力租赁或容许以成为目前解题的打破口。
在杨光看来,企业采取租赁办法利用算力能够弹性供应算力,知足不同模型演习所须要的算力需求。

“由企业自身培植、运维算力设备所需的投入非常高,并不是一样平常企业所能承受的。
可以参考的办理办法,首先是统一培植集中化的算力中央,统一分配,部分头部企业已经开始了这方面的布局。
其次便是算力租赁,通过政府搭线,给企业供应优质的、相对廉价的算力,降落企业本钱。
”王鹏说道。

天使投资人、资深人工智能专家郭涛从通用算力和智能算力的细分角度进行了剖析,他表示,当前部分地区已涌现通用算力过剩征象,算力租赁可以有效办理算力供需对接问题。
不过,当前大模型培植所更须要的是智能算力,智能算力受到智能打算中央培植滞后和高端芯片难以获取等方面影响,市场供给不敷,对人工智能干系家当的规模化、普惠化落地产生负面影响。

“算力租赁虽然可以在一定程度上平衡算力需求,但并不能从根本上办理算力稀缺问题。
未来,随着大批智能打算中央项目培植运营,有望从根本上办理智能算力瓶颈问题。
”郭涛说。

“过去几年以通用算力为主,智能时期尤其ChatGPT时期则以智能算力为主。
”杨光指出,办理大模型企业的本钱还是要加大智能算力根本举动步伐培植,“北京也正在先行先试培植多个公共智算平台,除了我们位于门头沟的北京昇腾人工智能打算中央外,海淀正在方案北京人工智能公共算力平台,朝阳也在方案北京经济算力中央等。

北京商报 方彬楠 陆珊珊/文