现阶段供应端算卡价格和紧缺程度如何?供给端与需求端是否相匹配?全国百余个智算中央是否都满负荷运行?培植智算中央何时能回本?人工智能算力如何实现高质量发展?环绕五个核心问题,财联社采访了多位家当人士。

据财联社梳理,此前AI算力供给端紧缺的局势有所缓解,但供需两端不完备匹配,导致部分智算中央利用率较低。
各地政府、企业的智算中央方案虽习认为常,真正能落地投入利用的数量或不及预期。
有从业者估量,部分智算中央三四年旁边能够“回本”,与此同时,算力高质量发展亦受业内重视。

算卡价贴近发卖商本钱线

“算力供应紧张确实是这几年一个比较普遍的征象,算力能力好、生态适应性较好的产品,确实是很多人都抢着买。
从利用者来讲,当然希望智算能力能够更好地支撑运用。
”站在算力做事器供应商角度,浪潮云海首席科学家张东接管财联社采访时表示。

AI智算中央现状五问|行业调研

张东见告,智算供应紧张存在周期性。

供给端当下状况如何?上海六尺科技集团董事长、恒润股份(603985.SH)子公司上海润六尺科技有限公司总经理张亚洲向财联社表示, “今年算力市场供应是有的,不像去年缺得很,目前各种打算卡的价格已经贴近发卖商本钱线了。
现在行业内各种项目参与的人多、中介也多,原来做电脑做设备的、ICT通讯行业的全部‘卷’进来,但实在真正做成、做好的不多。

近期,A股部分跨界智算玩家透露出了压力,如:莲花控股(600186.SH)旗下莲花紫星目前已签署的部分算力做事条约,可能存在收回采购本钱实际所需韶光超出预期或无法收回的风险,截至今年8月,莲花紫星仍处于亏损状态,整年能否盈利存在不愿定性;奥雅股份(300949.SZ)全资子公司奥创引擎与供应商润信供应链协商签署《算力做事器采购条约补充协议》,原操持采购的128台内嵌英伟达GPU芯片的高性能运算做事器数量变更为8台。

据张亚洲不雅观察,今年6月-8月,GPU终端价格呈持续下跌态势。
“去年的项目今年上半年都被消化掉了,今年在进行的项目紧张有两种情形:一是企业研发真正须要算力,紧张集中在大型互联网公司,二是一些地区拿了补贴、能源指标等配套培植智算中央。

据理解,9月市场才涌现了一波“扫货”征象,“紧张是受淡旺季和国际环境影响,但实在市场现货资源并不多。

亦从一位业内人士处获悉,“之前4090的价格从一万三千多涨到一万六七千了”,不过据称涨价紧张由于《黑神话:悟空》对该款显卡需求较强。

其余张亚洲称,市场还存在算力供给零散的征象:部分供给方“可能只有5台、10台做事器,大一些的是64台、100多台,大批量的基本很少。
这种供应商可能会承接一些实验室、学校的散单需求。

供需两端不完备匹配

几位从业者见告财联社,供给紧缺缓解并不虞味着智算需求不及预期。
张亚洲称,智算需求呈增长态势,且不断有新的需求产生,不过当下需求方已趋于理性。

深圳人工智能家当协会实行会长范丛明在接管财联社采访时谈到了不同类型需求方的现状:头部企业、科研高校算力资源充足,而当下家当垂直大模型正在大量研发,中小微企业算力紧张的情形存在。

值得把稳的是,智算中央培植风起云涌,干系招投标项目逐月递增。

此前数智前哨宣布,据不完备统计,仅今年前7个月,环绕土建根本举动步伐和IT根本架构等方方面面的培植内容,智算中央干系项目中标公告已发布超140个,个中至少24个项目中标金额超亿元;7月海内公布的干系中标项目超40个。

中国信息通信研究院云打算与大数据研究所总工程师郭亮在刚刚落下帷幕的“2024中国算力大会”期间接管财联社采访时表示,“现在全国建了很多智算中央,据不完备统计,应有200个以上,但个中有90%的算力在1000P以下,意味着这部分算力中央对大模型演习来说浸染有限,往后的利用效率存疑。

“算力需求是很大,只不过现有类型无法知足用户需求。
无论是适配方面还是性价比角度,都达不到客户的预期。
”IDC中国剖析师杜昀龙对财联社表示。

张亚洲也认为,目前存在算力供应端和需求端不完备匹配的状况,“B端需求方一样平常都会找自己熟习的单位。
一个项目可能有几十个人过来询价,实际上只有跟项目方互助关系良好或者综合实力比较受认可才可能成交,并不一定因此最低价成交。

算力闲置是否普遍?

财联社把稳到,现阶段算力设备是否满负荷运行成为市场关注的焦点。

“现在很多算力已经得到了消化,但行业内确实存在小部分算力闲置的情形,比如说市场上可能有千台机器的供应量,但可能有几百台机器在闲置。
”张亚洲见告财联社。

据郭亮不雅观察,算力闲置并非是普遍征象,“我们团队支撑了很多省市的干系事情。
近期来看,据我们理解,宁夏算力中央的利用率还是很高的。

“现在比较普遍的是在网上卖内蒙古、西藏、新疆的算力,进行分时租赁,价格便宜,这就会导致建在广东等地的智算中央利用率较低。
” 范丛明见告。

谈及宁夏智算中央,郭亮剖析,当地整体电价现在虽无补贴,但仍有上风;当地智算中央的算力规模较大,对付大模型演习比较有用。
“其余对付智算来说,网络传输的性能哀求没那么强,数据完备可以通过线下的办法进行,这对我国中西部的智算中央来说是个比较好的运用处景。

“从前期培植的算力消化程度看,头部企业该当在80%,科研高校该当是30%-40%旁边,市场化培植的算力消化程度该当在一半旁边。
”范丛明对表示。

据范丛明不雅观察,字节、腾讯、华为、百度等头部企业“一直演习大模型,数据量越大,算力需求越大,险些不存在算力闲置情形”;科研高校算力“建得大、用得少”,闲置相对较多;中小企业算力闲置则相对较普遍。
由于定位不清、位置偏远、价格过高,前期培植的算力消化程度是不足的。

杜昀龙认为,算力是否闲置紧张看几个方面:上层软件对算力的调动、硬件之间的互联办法、硬件举动步伐与运用处景的适配、用户支配本钱。

9月初,腾讯云副总裁沙开波在接管财联社采访时也谈到了智算中央即便具备了硬件资源,但仍缺少配套软件能力,缺少实际的终端客户或运用处景等征象。

张亚洲称,算力涌现闲置,背后缘故原由较为繁芜,与各种智算卡的性能、项目方的运营、网络产品技能做事能力等均有关,而业内的核心关注点在于运用端是否有实际产出。

建智算中央几年能回本?

算力闲置导致部分智算中央本钱过高,是业内普遍关注的问题之一。

对此,范丛明认为,智算中央供应价太贵,用户用不起,就导致智算中央打算的连续性不足,本钱过高。

谈及智算中央运营问题,郭亮在“2024中国算力大会”期间对财联社表示,“近期大家在各种场合会常常看到算力调度平台的信息,但建了之后效果怎么样?据理解,有些地方花了上千万投资建了平台,由于设计理念、功能特色等问题,实际上并没有很好地利用起来。
目前全国还没有符合大家需求的平台涌现,而这对我国智算中央的整体运营特殊主要。

他进一步表示,“对付智算来说,纵然是政府投资也须要回报,更何况是企业。
现在业界确实是群雄纷争的局势,但还没有一统天下的角色涌现,当然我们也在努力,本次算力大会发布的中国算力做事平台(河南)便是我们推出的一个办理方案。

(财联社摄于2024中国算力大会现场)

关于智算中央如何平衡本钱和性能,范丛明见告财联社,“算力投资回收期一样平常是五年旁边,由于算力市场变革太快,还要加上电费、运营等其他本钱。
如果能找到头部大厂利用,我以为回本韶光大概在三四年旁边。

杜昀龙则认为,智算中央的运营方应制订长期方案,降落终极用户的利用本钱,培养利用习气,后期规复标价;重点培养运用案例,逐渐扩大覆盖行业。

由“量”转“质”何解?

客不雅观来看,中国算力发展依然任重道远。

2024中国算力大会发布的《中国算力发展报告(2024年)》显示,截至去年底,环球智算市场同比增长130%以上,而中国智算市场同比增长超过60%。

财联社把稳到,算力培植热潮之下,有从业者在上述大会上分享了诸多“冷思考”,并将目光聚焦高质量算力。

浪潮信息(000977.SZ)联合信通院发布的业界首个高质量算力评估体系《人工智能算力高质量发展评估体系报告》表示,高质量算力是基于最新人工智能理论,采取前辈人工智能的打算架构,与算法、数据深度结合的高水平打算能力。

财联社从浪潮信息方面获悉,当前算力集群实测性能和理论性能差距过大问题明显,部分算力实际性能不敷理论性能的10%。
公开数据显示,传统模式下的智算中央GPU利用率均匀数值低于30%。

张东认为,对付算力的关注不能仅仅关注芯片,“很多地方买算力,点名芯片的品牌,构建一个多大规模的算力中央,实际上看芯片指标没故意义,大家还是要从系统角度,综合考虑末了若何知足运用须要。

郭亮也表示,“目前,我们在芯片这一层选择不多。
但打算和网络领悟方面是一个热点。
目的是把一台AI做事器,从现在的8卡扩展到32卡、512卡,这对智算集群的能力,包括集群的支配、上线、运维都有益处。

财联社多方采访获悉,大规模智算落地绝非大略的规模数量堆叠,其繁芜程度呈指数级增加,对智算培植运营者的技能实力、资源上风、家当协同能力有着很高的哀求。

至于智算中央如何由“量”转“质”,郭亮称,“培植智算中央须要‘适度超前’,结合当地实际需求做整体的剖析和预判。

本文源自财联社 付静