智谱AI在“百模大战”中成为镁光灯下的焦点,是在今年10月20日。当它首次对外发出“年内得到超25亿公民币融资”的时,外界才创造,这家公司的估值已悄然超过百亿公民币。
它凭借什么成为成本的“宠儿”,并拿下海内AI(人工智能)大模型创新领域的最高估值?
技能基因
智谱AI的核心团队紧张从清华大学 KEG(知识工程)实验室走出。智谱AI董事长刘德兵师从中国打算机行业专家、中国工程院院士高文;CEO(首席实行官)张鹏和总裁王绍兰则同为清华创新领军工程博士。此外,他们三人也都是KEG实验室的核心成员,带领团队从实验室走到市场,完成了“产学研”的第一步。
张鹏称,公司成立以前,团队在学校实验室做的一件事便是“科技情报剖析”,紧张是利用人工智能的方法,包括数据挖掘、语义剖析、机器学习、算法等知识工程下面的分支技能,去挖掘自然科学或技能发展的客不雅观规律。
“一旦节制了这个客不雅观规律,人们便可以‘预测未来’。”张鹏说,与早期没有太多科学方法,预测方案可能“拍脑袋决定”不同,他所在的实验室团队会基于数据和剖析技能,创新设计和研发了海内首个中英文平衡的跨措辞知识图谱系统XLORE,还推出了AMiner系统。
在此后长达十年的韶光里,他们一贯积极地通过家当的实际项目进行着技能成果工程化落地运用的摸索和探路。
张鹏说,智谱AI成立时就有个愿景目标,“未来让机器像人一样思考”,也有一个努力超越的目标工具,“对标OpenAI(开放人工智能研究中央)”。当时还是2019年,除了人工智能圈内,没有人知道OpenAI是谁。
实际上,早期OpenAI的措辞模型预演习框架GPT,上风并不明显。迁移转变点发生在2020年6月,OpenAI发布了GPT-3,正逢周年庆的智谱AI,意识到了GPT模型的能力已发生越级式提升。
在那时,张鹏团队选择全部投入到超大规模参数大模型。不过,他们选择了与OpenAI不同的路径,将GPT这类单向向后预测的模型框架,与谷歌的BERT这类双向预测的模型框架的能力加以结合,这套预演习框架被命名为GLM,即通用措辞模型。
空想主义
模型创新是一个经年累月的过程。在发展方向确定后,智谱AI用时一年,于2021年推出了自研的GLM百亿参数模型,当时海内鲜少有人知道这一创新的意义所在。
次年7月,伴随千亿级超大规模预演习模型GLM-130B的出身,智谱AI还基于这一千亿基座模型,开始了商业化布局,打造了大模型MaaS(模型即做事)平台及AIGC(天生式人工智能)产品矩阵。
那一年,斯坦福大学根本模型研究中央对包括ChatGPT干系的InstructGPT模型等在内的环球范围内将近30个大模型进行综合评定后天生了一个榜单,个中智谱AI的GLM-130B成为唯一登榜的中国基座模型。
提前看到趋势,使得智谱AI团队“一步早,步步早”。各家大模型厂商基本在2023年年中纷纭推动模型开源,并论及生态问题,智谱AI则提早了一年韶光。
2022年8月,智谱AI不仅在GitHub(面向开源及私有软件项目的托管平台)上开源了GLM-130B,还发力模型开源生态培植。2023年3月,在推出千亿基座的对话模型ChatGLM后,智谱AI面向研究者和个人开拓者,连续开源62亿参数的单卡版模型 ChatGLM-6B。截至发稿前,ChatGLM-6B系列模型在开源社区的下载量已打破千万。
不少人形容2023年AI大模型领域像是一场“武备竞赛”,科技领域的巨子与创业团队,重金囤卡,投身个中,从模型创新到演习优化,智谱AI在个中自不会掉队。不到半年韶光,ChatGLM从第二代进化至第三代。
开源生态的深入构建,以及技能能力上与国际顶尖模型“掰手腕”,都让智谱AI在圈内愈发火爆。在开拓者认可之外,也吸引了美团、阿里、腾讯、顺为、红杉、高瓴等投资人看好,这也使得智谱AI成为了海内第一家估值破百亿的大模型创业公司。
智谱AI一贯坚持算法等技能自主研发及创新运用。不过,“实质上来说,还没有离开Transformer这个模型体系的底座和根本”,张鹏说他现在有一个期待,智谱AI能够往下且深入地撼动当前模型框架的研究技能,“做真正厉害的事情”。
|对话|
创新背后
经济不雅观察报:在2019年创立伊始,智谱AI就确定“对标OpenAI”。智谱AI是如何提前瞥见趋势的?
张鹏:这是由于我们比较早地创造了人工智能技能发展的规律。当时我们不雅观察到的一大趋势是,上一代人工智能技能的研究已经基本趋平,这就像一条S曲线,增长之后,碰到天花板便会放缓。
人脸识别、图像识别等AI创新之后,下一代技能是什么?我们想找到未来3至5年内会再涌现新的增长曲线。当时我们创造,深度学习带起了第一波AI浪潮,由此产生了像图神经网络等技能方法后,又有了预演习这样一个非常通用且能取得比较好效果的下一代技能。
可以看到,2017年Trans-former被提出来之后,2018年时,外洋便涌现了谷歌的BERT以及OpenAI的GPT等创新。当时,预演习等干系技能在学术界发展速率飞快,工业界虽然相对迟缓,还未觉得到变革,但技能效应已经能印证,一个拐点即将到来。
那时,我们基本上也可以判断,人工智能技能曲线已经进入了一个新的上升期。当时是2018年后,在那个阶段我们在不雅观察国际上做预演习干系事情的机构、团队的研究动作时,OpenAI进入了我们的视野。
OpenAI并不是从第一天开始就在做大模型这件事情,我们同样也是如此。从最初研究预演习框架创新到后来武断投入且专注于通用模型开拓。其余,我们也较早地布局了AI产品矩阵,比OpenAI晚不了多少,这让我们在商业化方向上也有相似之处。
经济不雅观察报:从研究者到企业家,你如何适应角色的切换?
张鹏:我们创始团队里面的几个人绝大部分都是技能工程师出身,可以肯定地说,我们的措辞体系和思维逻辑都比较靠近。其余也有一些具备丰富市场履历的“队友”,以是,智谱AI实际上是一个团队一起来商榷并制订一些策略。
其余,我们在学校里时,也并不是纯挚做研究。我们的KEG实验室创始人王克宏教授,从成立之初就跟我们说,要做“互联网环境下的大数据知识工程”,1996年时,这一理念极具前瞻性,王教授以为互联网这件事是未来一定要做的,而有了互联网之后,个中的数据、知识等如何运用,则成为我们要做的事。
当时海内还没有多少人知道“知识工程”这个词的定义。但王教授认为纯挚做理论研究、不做工程,这件事情是没有未来的。他当时给实验室的所有学生提了一个词“P2P”,他的阐明是“PapertoProject”(从论文到项目),也便是一定要工程化技能的成果。
以是,我们这个实验室很有特点,不只做研究,还得做工程,要让研究落地。这也造就了全体实验室的风格:一帮工程师边做研究,边去冒死地做工程,把技能运用到用户的需求场景里面去。
也正因如此,我们这个团队走出来,去做公司的过程非常自然,转换也不是一夜之间的突变,是一个逐步理解和扩增的过程,更是顺应商业逻辑和规则后,逐步转变的过程,量变引起了质变。
经济不雅观察报:智谱AI在大模型研发的过程中,碰着过哪些难题和焦虑?
张鹏:哪有不难的事情。正因难堪,才会有代价,常日都是这样。
所有的人工智能技能创新,都会在数据、算力、算法三大方面存在着各种寻衅。数据自不用多说,大家都在同一个起跑线上,难是一样的。算力紧张是资源有限,那么多团队在做大模型这件事,本来有限的资源就会被分摊。
当你想要去打破这个天花板,持续往上做未知领域或前沿技能拓展的时候,就会创造,资源供给会变得越来越难。
早期的一些模型,都会用到像英伟达的A100、A800之类的芯片做推理,这个东西现在有多贵,大家都知道。就算不买,租一台这样的高端做事器,也只能同时做事并发的几个或十几个用户的访问。
为降落本钱,我们在不断提升推理效率的同时,也通过与国产芯片厂商互助,用更便宜的算力、消费级的卡做推理。这样,价格差异就会表示出来,当前“降本”的条件是做事质量不低落,用户体验上是更好的“提效”。
相较来说,算法创新,一贯是我们坚持自主研究的方向。
模型共识
经济不雅观察报:目前AI家当发展有共识吗?
张鹏:环绕大模型,大家关心的问题依然很多,但令我感触比较深的一点是,大家对付大模型,基本已经没有质疑。
天生式AI在海内真正火热起来,是从今年3月份开始,到现在过去了也就大半年韶光。这么大的一个覆盖范围,近乎征象级的技能创新,在这么短的韶光里,就让大家形成了一个共识,这让我以为是很难得的一件事情。
我说的这个是宏不雅观角度的大共识,大措辞模型或者说大模型这件事情,它一定是一个趋势。特殊是从人工智能发展的角度来说,在未来的一个韶光段里,大模型创新一定是“精确”的。它是一个我们想要达到推动技能发展和实现AI呈现的目标的有效方法。
经济不雅观察报:共识之下有不合吗?
张鹏:没有一条路是轻松的,尤其是这种变革性、打破性的事。
大家之以是达成共识,条件是大家根本找不着其余一条路,目前看起来,这条路是唯一或相对来说更有可能走下去的方向。
要说难,算法、数据、算力,每一个都很难,乃至在这三个维度之外,还有AI管理,涉及技能的安全伦理等一系列社会问题等须要研究。
故意思的点在于,你会创造,大家在对大模型形成共识的根本上,还会纷纭从各自的角度去看待这件事情,贡献自己的力量、聪慧,去办理干系一些问题。
经济不雅观察报:在百模大战中,你认为智谱AI处于什么位置?
张鹏:首先在技能上,从第三代基座大模型ChatGLM3的一些新进展来说,我们有比较强的信心。
其余从商业化的角度,我们也是海内最早提出商业化落地路径的企业,从一开始就在做ToB(面向企业)和ToG(面向政府)的一些做事,大部分的客户都是上述机构类型。对我们来讲,商业化不是一个选择,是天生的基因里就带着的东西。
技能创新的路上当然会有一些参照,比如说比拟OpenAI的路径,智谱AI在向天下最顶尖水平学习之余也考试测验超越,在与外洋上风技能能力“掰手腕”的同时,也结合当前海内市场和商业环境的特点来做领悟创新。
这是一个不断积累、不断量变的过程。
经济不雅观察报:如何看待AI家当的未来?
张鹏:中国市场有这样一个特点,业态的变革会非常剧烈与快速。
AI行业须要韶光发展,从现阶段的行业动态看,就任它纷纭扰扰吧。我们有自己的目标,“让机器像人一样思考”,也有自己的对标参照。发展过程中,作为一家商业公司,智谱AI可能须要进行很多的计策调度,但这个调度绝对不包括我们的紧张目标和方向,在这一点上我们是很明确的、武断不移的。
我一贯跟团队讲,要有一种计策上的定力和一种战术上的灵巧性,这种结合才能很好地应对市场的各种变革。