据OpenAI测算,2012年开始,环球AI演习所用的打算量呈现指数增长,均匀每3.43个月便会翻一倍,目前打算量已扩大30万倍,远超算力增长速率。随着百度、360、华为等公司纷纭入局AI领域,海内厂商对算力的需求将迎来井喷。
综合OpenAI的研究履历,以及中国企业大模型的研发进度等成分,广发证券剖析师刘雪峰等对海内AI大模型的演习和推理阶段算力需求,以及相应的本钱进行了测算。
算力需求
首先,剖析师根据GPT-3的数据测算了海内AI大模型演习和推理所需的AI做事器需求。
剖析师认为:
根据商汤招股解释书的数据,GPT-3的大模型的所须要演习355个GPU-年。在当前各家公司推出AI大模型意愿较强的背景下,我们认为科技公司用于演习AI大模型的韶光为1个月,因此其须要演习AI大模型的AI加速卡的数量为4260个。
我们认为,AI大模型有望成为各科技厂商竞争的关键领域,因此假设海内故意愿开拓AI大模型的公司有10个,则由于AI大模型演习而新增的AI加速卡需求空间为4.3万个,海内由于AI大模型演习而新增的AI做事器的需求空间约为5325台(本文均假设单台AI做事器搭载8个AI加速卡)。
根据英伟达官网的数据,A100针对付BERT类的AI大模型可实现每秒推理1757次,因此可假设单片A100用于AI大模型每秒天生1757个单词,与单次客户须要天生的内容数量相称。
截止2023年3月27日,百度“文心一言”已收到12万家企业申请测试。我们估量,国产“类ChatGPT”的访客量规模较为弘大。
2023年3月29日,在“2023数字安全与发展高峰论坛”上,三六零公司现场演示了360大措辞模型在360浏览器上的运用。剖析师认为,内容天生类运用已成为各科技厂商开拓AI大模型积极探索的方向,因此假设海内未来开拓并运用“类ChatGPT”AI大模型的数量为10个。针对不同情境剖析师进行了以下假设:
国产“类ChatGPT”的定位是仅给注册企业内部利用,则假设每天访问量为5000万人次,每人与ChatGPT对话5次,由此测算下来,由于AI大模型推理而新增的AI加速卡需求空间为4.3万个,新增的AI做事器需求空间为5425台。国产“类ChatGPT”的定位是面向个人用户开放利用,则分别假设每天访问量为1亿或3亿人次,每人与ChatGPT对话5次,由此测算下来,由于AI大模型推理而新增的AI加速卡需求空间为8.7万或26.0万个,新增的AI做事器需求空间为1.1万或3.3万台。因此,乐不雅观假设下,海内AI大模型在演习与推理阶段或将产生相称于1.1万台或3.8万台高端AI做事器的算力需求。
本钱测算
此外,剖析师强调,多模态大模型是AI大模型的发展方向,运用前景广阔。今年以来,环球多家科技厂商陆续发布多模态大模型,如谷歌的PaLM-E大模型、OpenAI的GPT-4大模型以及百度的“文心一言”大模型。
相较于自然措辞类模型,多模态模型在演习阶段领悟了笔墨、图像、三维物体等多维度数据的演习,可交互的信息类型较多,通用性得到了大大增强。剖析师参考OpenAI和百度的AI大模型的收费标准后,对各行业用户用于天生类任务的本钱进行了以下假设:
天生文本的价格为0.003美元/1000tokens,相称于0.02元公民币/1000tokens(参考汇率:1美元=6.88元公民币)。Tokens是包括了单词、标点符号在内的字符,因此可以大略理解为单个笔墨。天生图片的价格为0.02美元/张,相称于0.15元公民币/张。多模态大模型API开放后,各行业用户用于内容天生类任务的利用本钱敏感性剖析:基于以上假设条件,我们对各行业用户调用多模态大模型的API用于内容天生任务的本钱做关于文本天生量和图片天生量的敏感性剖析。
我们估量中短期内,基于多模态大模型的单日调用量的范围估量在5000万人次到3亿人次之间。假设每天每人天生文本内容5次,每次天生文本内容为1000个tokens,则天生文本数量的范围估量在2.5千亿到15千亿个tokens之间。
假设每天每人天生图片5张,则天生图片的数量范围估量在2.5亿张-15亿张。由此,我们测算出,各行业用户调用多模态大模型的API用于内容天生任务的本钱如下表所示。
剖析师也强调,AI大模型技能仍处于发展早期,技能迭代的节奏和方向处于快速变革中,在AI算力需求测算中,也需考虑由于算法优化导致AI模型花费算力本钱降落的成分。考虑到软件优化带来的降本提效成分,实际硬件需求和算力本钱可能较此前测算的数值较低一些。
综上,剖析师指出,在暂不考虑软件层面算法优化带来的模型花费算力本钱低落的条件下,海内大模型在演习与推理阶段或将产生相称于1.1万台或3.8万台(乐不雅观假设下)高端AI做事器的算力需求,以单片A100售价10万元公民币、AI加速卡代价量占做事器整机约70%打算,则对应约126亿元(公民币)或434亿元增量AI做事器市场规模。
剖析师估量,前述AI做事器的增量需求或将在1-3年的维度内逐步落地。
本文紧张不雅观点来自广发证券剖析师刘雪峰(执业:S0260514030002)等发布的报告《海内AI大模型的演习和推理阶段算力需求测算》,有删节
本文来自华尔街见闻,欢迎下载APP查看更多