Sora环球爆火,我们的算力准备好了吗?
最近,作为一个生活在“中国最互联网城市”的深圳市民,我溘然萌发要写这样一篇文章的想法。然而,作为一个人工智能领域的小白,我并不知道该从哪些方面下笔。
于是,我准备了一些问题,想要请教业内人士为我解答。经由一天的资料搜集,我终于将问题拟好,但是发给他们后,等待回答须要两天韶光。
迫于时效性,我又十分想急速知道这些问题的答案——
于是,我把个中一些问题分别发给了“WeTab AI pro”“文心一言”“讯飞星火”三个平台,很快我就得到了相应的答案。
(图为WeTab AI pro的回答)
(图为文心一言的回答)
(图为讯飞星火的回答)
在这三个不同的平台中,我得到回答的韶光分别是“即刻”“3秒”“10秒”;面对专业回答,我即将等待的韶光是“两天”,不同的回合时光便很好地阐明了——什么是算力。算力的发展,意味着效率的提升与跃迁。
如果想让现在与我对话的模型变得更加聪明,就须要对模型进行不断的演习。演习大模型,不仅须要被注意灌输海量的数据,还须要繁芜的数学打算、更是动辄千亿级别的参数;没有足够的算力,就无法快速地处理这些数据、无法快速更新这些参数,更别说让模型表现得足够聪明伶俐。
以ChatGPT为例,演习它所耗费的算力大概是3640PetaFLOPs/天,相称于用每秒运算1000万亿次的算力对模型进行演习,须要3640天才能完成。
数据被视为最宝贵的资源,是一座富矿,而算力则被视为是挖这座矿的工具。通过算力对数据进行处理,就能挖掘巨大的数据代价,创造财富。恰是以,算力才会被视为人工智能时期下的核心竞争力。
制约与突围
在环球经济复苏面临较大不愿定性的同时,数字经济依然保持强劲增长,算力已经成为经济增长的主要驱动引擎。
只管2023年8月的数据显示,我国在用数据中央机架总规模超过760万标准机架,算力总规模达到每秒1.97万亿亿次浮点运算(197EFLOPS),位居环球第二,算力总规模近5年的年均增速近30%。
但有干系数据呈现,从人均角度来看,中国仅处于中等算力国家水平。
天下各国人均算力比拟(2020)(图源:《泛在算力:智能社会的基石》)
备注:原数据来自罗兰贝格咨询公司
业内人士先容,我国和国外的算力发展紧张存在三方面的差距:算力层面、芯片技能及算力商业模式。
算力层面紧张表示在国内外大模型的差距。目前海内已经发布的大模型产品有百度文心一言、讯飞星火、Kimi等,但是从试用结果看,和ChatGPT、GPT4仍有一定差距。
一方面是由于算力根本举动步伐规模小于微软的规模水平,因此演习精度水平并不深;
另一方面是海内做AI大模型的韶光相对较短,还需后续的优化。在OpenAI做出产品之前,这个领域一贯没有商机和盈利,因此很多互联网企业都没有实际落地该运用,ChatGPT火了之后,互联网大厂才加速推动大模型产品。
当然,大模型的正常运行,离不开最为核心的载体——芯片。如ChatGPT所耗费的算力(3640PF/天),若换算成英伟达A100芯片,空想情形下统共须要大概6000张,在考虑互联损耗的情形下,则须要一万张A100作为算力根本。
“2022年10月,美国限定英伟达和AMD向海内出售高性能打算芯片,海内能够买到的GPU芯片数量比较有限。然而,高性能GPU芯片代表着这个时期‘顶级聪明的算力’,这个水平的芯片面临缺货,正在成为我国发展高水平AI技能的紧张限定成分。”业内人士表示。
另一位业界人士指出,“去年12月,有剖析机构曾给出了详细的数据:H100的性能达到1979Tflops,而A100的性能为624Tflops。而就最强的国产AI芯片而言,其性能仅为512Tflops,与A100比较仅有四分之一的算力。此外,国产AI芯片在单位算力功耗和发热等方面也存在一些问题,掉队于英伟达的A100和H100。考虑到AI演习和推理等任务对大量芯片的需求,国产AI芯片的高功耗成为企业难以承受的包袱。”
虽然我国在算力家当链后端(半导体家当)须要作出长期努力,但在算力家当链前端(供应算力做事或做事器)是具备较强竞争力的。环球市场只有美国和中国拥有规模化的云厂商,海内各行业也呈现云化转型的发展趋势。
但仍需把稳的是,我国的云打算厂商整体上并不赢利。据统计,中国七大云打算厂商加起来,环球份额低于20%,年业务亏损总和超百亿元。国外紧张云打算厂商(微软、亚马逊)已经有了成熟的商业模式和稳定的利润回报。本土企业面临的最大压力,是长期在环球算力家当链的代价分配中处于劣势,使之难以进入商业可持续的良性循环。
当然,真正的算力竞争,并不是各个企业、科研院所纯挚比拼谁每秒打算多少次,而是如何让算力流动起来,更大程度开释算力的利用率。
IDC(国际数据公司)数据显示,(环球紧张经济体)企业分散的小算力利用率,目前仅为10%~15%,存在很大摧残浪费蹂躏。激活现有的算力资源,精准做事需求,要比纯挚堆砌算力、去世磕芯片更有代价。
构建更大范围的算力网络便是正在探索中的可行思路,我国推动的“东数西算”工程,便是算力网络理念的一次落地实践。东部地区明显对算力需求更高,西部地区由于制冷本钱低(气温低),能源便宜(运输本钱低),算力本钱自然更低。借助成熟可靠的通信网络根本举动步伐,将低时延哀求的算力迁往西部地区,全国统一资源调配,可以实现更好的算力性价比。
去年12月尾,国家发展改革委等部门联合印发了《深入履行“东数西算”工程 加快构建全国一体化算力网的履行见地》,相对“东数西算”工程启动之初的最大不同是,其提出了更清晰的办理方案,并给出了截至2025年底前的一系列明确培植目标。
谈及如何拉长板补短板,业内人士表示:“一方面,我国在根本举动步伐培植方面具有速率快、本钱低的上风,这有助于快速支配算力根本举动步伐,如数据中央和通信网络;另一方面,我国拥有弘大的国内外市场和用户基数,这也为算力运用供应了广阔的市场空间和需求潜力。相信随着有关政策的出台和更多资金的投入,我们将不断发挥现有的上风,在算力领域实现快速发展,逐步缩小与国际前辈水平的差距,并在某些领域实现领先。”
深圳:算力先锋城市的崛起与展望
国际数据公司(IDC)在《2022环球打算力指数评估报告》中指出,中国的算力家当规模和多样性目前正持续高速增长,2018年—2022年,北京、杭州、深圳的算力规模位居全国前三。
我所处的城市——深圳,作为中国改革开放的前沿城市,正在积极打造算力先锋城市,以推动数字经济和人工智能家当的高质量发展。
根据《深圳市算力根本举动步伐高质量发展行动操持(2024-2025)》,深圳操持到2025年,通用算力达到14EFLOPS(FP32),智能算力达到25EFLOPS(FP16),超算算力达到2EFLOPS(FP64),存储总量达到90EB。前辈存储容量占比达到30%以上,重点行业核心数据、主要数据灾备覆盖率达到100%。
在算力根本举动步伐方面,深圳以政府、电信运营商、大型互联网企业、独立第三方为主力,位于深圳的国家超级打算深圳中央、鹏城云脑等算力根本举动步伐,为人工智能家当的发展供应了坚实的算力保障。
据理解,去年11月举行的环球超级打算大会期间,鹏城云脑II存储系统凭借在全节点测试中超过21万分的表现,连续第七次夺得超算存储500强(IO500)榜单环球第一。此前,2022年6月,鹏城实验室牵头联合海内十多家打算领域的领军企业、科研机构启动的“中国算力网”研究操持取得打破,一期工程“智算网络”正式上线,跨域纳管了20余个异构算力中央。
以鹏程云脑为代表的深圳算力根本举动步伐,是如何成为引领深圳发展的 “风向标”“梧桐树”的?它的培植,又有哪些可供参考的深圳聪慧与履历?
对此熟知的业内朋友做了更加详细的分享:
一是义务担当定位高。鹏城实验室联合华为和国家新一代人工智能家当技能创新计策同盟AITISA等,方案培植——“鹏城云脑”。目前,鹏程云脑与鹏城实验室的“鹏城云网”“鹏城靶场”“鹏城生态” 等科学根本举动步伐相互合营、相互促进,形成了独具特色的生动高效科研发展态势。
二是用人机制新、聚拢人才快。鹏城实验室采取海内子才“双聘制”和国际人才“条约制” 的办法,实施“固定+流动”人才管理机制,多方协力,冲破了“部门”和“行业”的界线。鹏城实验室灵巧的人才流动聚合模式,也快速集聚了一批海内外高层次科技人才。
三是深化运用覆盖领域,赋能浸染强。鹏程实验室为反哺深圳市投资,专门推出鹏程云脑100P的算力,免费供全市中小企业申请利用。运作机制上,由于中小企业算力需求频繁多样,鹏程云脑不直接面向中小企业,而是将算力划拨给市工信局下属的创新中央,由创新中央卖力算力调配。支撑赋能上,除了算力供给,鹏程云脑还开拓了许多根本软件、根本算法供中小企业利用。
“深圳充分发挥算力根本举动步伐对数字经济‘聚合器’、‘孵化器’的浸染,有效促进了人才、资金、技能、数据等要素的联动,从而优化数字经济发展生态,带动新能源、电子信息、高端装备等干系家当快速发展,这是我们应该从中汲取的‘深圳履历’。”他表示。
另一位业内人士则从“算力生态构建”的宏不雅观角度出发,先容了深圳有望成为算力先锋城市的内在基因:
从家当链协同发展上看,深圳集聚了华为、腾讯、安然等领军企业,以及晶泰科技、云天励飞等一批“领头羊”和“独角兽”企业,形成了覆盖根本层、技能层和运用层的完全人工智能家当链。这种家当链的完全性为算力培植供应了强有力的支撑。
从算力资源整合上看,深圳不仅构建全市“算力一网化、统筹一体化、调度一站式”城市级智能算力平台;还与周边城市互助,培植企业级智能算力平台;联合喷鼻香港企业、科研机构、高校,打造深港人工智能算力中央等。这种方案与区域互助,有效整合了社会多元算力资源,提升了算力供给的效率和水平。
从市场供需导向上看,深圳出台《深圳市极速宽带先锋城市2024年行动操持》等系列政策,有助于明确市场预期,促进供需平衡;此外,在工业、前辈制造业等上风重点行业,深圳环绕交通、能源、园区等企业场景,积极开展算力运用创新,供应算法公共做事,从而更好地知足市场需求。
“如今,深圳在算力发展上已经取得了一定的造诣。然而,在芯片设计、高性能打算、人工智能算法等关键领域,深圳还需利用现有的人才、资金、技能上风,持续加大在算力核心技能上的研发投入,从而推动算力的进一步提升和拓展运用。”他说。
欢迎算力浪潮,我们不必妄自菲薄
在我们核阅家当发展时,一个主要的问题是:须要多少资源?
Sora的兴起让我们见证了OpenAI在从文本到视频领域的打破,然而,我们不能忽略的是背后所投入的巨大本钱,包括数据演习和算力支持。ChatGPT依赖着约3万块GPU芯片供应算力支持,而Sora对算力的需求更是巨大。
据外媒宣布,OpenAI的创始人正力争筹集高达7万亿美元的资金,用于支持公司的半导体操持。这一融资规模相称于2023年英国GDP的两倍多,对付多数国家而言,这样的资金投入都是不现实的。
如果我们希望创造比Sora更智能的AI模型,我们所需的数据和算力是无法预知的。然而问题在于,如果人们不断投入巨额资金用于争夺算力,终极研发出智能认知模型,又将为人类带来什么?大概AI能创作出更精良的文章、漫画、视频,可人类却被迫在事情中与AI竞争。人工智能的发展旨在更好地为人类供应做事,而并非取代人类。
因此,除了不断发展通用大模型的算力和硬件,我们也在努力在特定领域进行开拓,例如智能驾驶等专用大模型的运用,由于这须要的资金更少,而且可以直接应用于家当领域。总而言之,这便是我们国家在人工智能领域发展的逻辑。今年两会期间,与人工智能干系的新闻宣布数量创下了历史新高,个中大部分与人工智能赋能家当有关。
与须要大量资金和算力的通用大模型比较,选择先确保AI为实体家当赋能,实现降本增效,这样才能更有效地利用资金。我们本日能够便捷地购物、能够考试测验AR、VR等虚拟现实、能够体验更智能的家居与出行,都要感谢不断进步的“智能工厂”“互联网络”。
因此,没有必要过分浮夸Sora的神话,也没有必要贬低自身。确实,长期以来,我们的科技发展一贯在不断摸索前行,而现在在人工智能领域,我们也须要更多的开拓精神。
然而更主要的是,不是看别人在做什么,而是要清楚自己要做什么。
内容来源:圳经事