编辑 | 邓咏仪

在今年的天下人工智能大会(WAIC)逛蜜度的展台,会有一种来到了做AIGC运用的To C企业的错觉,与会者可以体验用AI写诗、作画,并领取AI制作的明信片。

WAIC蜜度展厅。
图源:蜜度

这次,长年为政企供应措辞智能做事的蜜度在WAIC上一口气发布了三个垂直领域的大措辞模型:蜜巢知识问答与内容天生大措辞模型、蜜巢智能舆情剖析大措辞模型、智能校正领域大措辞模型“蜜度文修”。
这三款措辞大模型紧张为新闻出版、媒体采编、政府公函领域供应智能化的做事。

蜜度CTO刘益东AI技能成长的成果要让通俗人都能理解  最前哨

蜜度CTO刘益东见告36氪,以前蜜度参加过不少展会,采纳的都是在屏幕上展示产品专业参数的形式。
从去年WAIC开始,蜜度开始用普通用户都能理解的形式呈现技能能力,不雅观众可以对AI技能进行现场体验。

他打了个比方:“我们的展台,想让爷爷奶奶辈也感想熏染到AI的智能便利。
好比大墨客杜甫常将写好的诗念给不识字的老婆婆听,以便普通易懂。

7月6日的WAIC开幕式上,“深度学习之父”杨立昆重申“LLM不会是那条通往人类智能的道路”。
这也让许多厂商跳脱出Transformer的框架,去做创新。

发布自研的行业基座大模型,是今年蜜度的目标。
刘益东以为,自研行业基座大模型是蜜度的方向:“下一个创造风口的可能就不是OpenAI,海内厂商要捉住机会。

以下是刘益东和36氪的对话:

先垂直,后通用

36氪:这次蜜度和友商们同台秀大模型肌肉,为此蜜度做了哪些准备?

刘益东:我以为这次WAIC大家会有一些同行竞争的压力,但更多地是抱着互换学习的态度。
虽然很多厂商都推出了大模型,但是聚焦的垂直领域是有差异的。
我以为作为企业,须要更多地思考我们的上风在哪里,以及怎么为客户和用户带来实用、便捷、高性价比的AI做事。

36氪:那关于这个问题,蜜度的思考结果是若何的?

刘益东:在过去的十多年韶光里,蜜度紧张做事的是政务、媒体、企奇迹单位的办公需求,也积累了一定规模的客户,以是我们接下来发力的点还是会从这些行业延伸,包括会逐步地触及教诲行业的B端客户。

我以为蜜度的上风首先在数据能力,在2017、2018年的时候我们已经把AI的一些能力通过产品赋能用户了,在大量高质量行业数据的根本上,蜜度能够更好地实现运用落地。

其次是客户履历的积累,我们对客户需求的认知和理解程度还是很高的,虽说现在方案仍须要风雅打磨,但至少现在我们已经有干系的根本,能在未来给客户供应“开箱即用”的成熟方案。

末了是蜜度对科研的投入,2019年公司成立了专门的科研机构“微热点研究院”,紧张用于与学界科研力量一起追踪前沿科技。

36氪:大会上蜜度先发了三个垂直领域的大模型,而不是一个通用的基座。

刘益东:是的,这次我们发布的几个模型是针对垂直领域的。

我们的目标是在今年下半年在已经发布的模型的根本上,去演习一个参数规模在千亿级的行业基座模型。
当然这个基座模型还是会方向于政务和媒体的场景。

36氪:先基于开源模型演习垂直领域的模型有若何的考虑?

刘益东:大模型领域的发展可以说这天月牙异,我们选择先做垂直领域的模型紧张是考虑了现实运用的需求。
由于基座模型的演习是一个漫长、投入大的过程,同时不是说一次就能得到很好的效果,而是要做很多方向的调度。
为了知足客户当下的需求,我们考虑先推出垂直领域的大模型,知足垂直行业运用的需求。

36氪:华为也有自己的“盘古大模型”,提出了垂直领域的模型办理方案,作为华为昇腾的客户,蜜度与华为会不会也形成竞争关系?

刘益东:在我的理解中,华为更多的是做一些底层根本举动步伐的事情,而我们的定位是偏中上层的运用。
全体AI生态不是说一个人就能把所有事都干完,大家各自都在做善于的事,以是我们一贯和华为都有良好的互助。

最难的是工程落地

36氪:ChatGPT带起的AI热潮也已经由客岁夜半年了,您以为算力、数据等哪些难点得到了一定的办理?哪些还是“卡脖子”问题?

刘益东:我以为算力、算法、数据,还有一些工程性的寻衅都是非常关键的成分。

先从算力讲起。
过去半年多的韶光里,各地的算力网络培植也很快。
比如上海的超算中央就在过去半年里供应给了我们很大的算力支持,实在培植的速率很快,并且它能够支持国产的异构算力,算力这个难点还是得到一定的办理。

接着是算法。
全体大模型开源生态在过去半年里发展得非常快。
最开始开源模型有千亿的参数,我们只能用小数据做试验。
后来更多的快速演习的框架面世,就能帮助我们仅用百卡的级别来演习一个百亿参数级别的模型。
以是通过半年的不雅观察和摸索,下半年我们具备了自主演习基座大模型的条件。

不过,在数据层面我们仍旧面临一些寻衅。
由于中文高质量的数据生态发展才几个月的韶光,当然这段韶光内各行各业都在建立高质量的数据演习集,个中一些因此开放的办法,我以为这是非常好的趋势。
如果办理了中文演习数据的问题,至少从大模型的算力、算法和数据三个角度而言,基本上不会有太多问题。

而最大的寻衅来源于工程落地。
大模型前期的落地步骤包括用户运用,本钱很高。
如何让大模型在内部落地,并且让客户高效利用好,这是蜜度这半年来在思考和在履行的。
目前我们已经做到把蜜度的大措辞模型支配在消费级的显卡上,比如说国产的华为昇腾NPU卡。

AI技能发展的成果要让普通人都能理解

36氪:蜜度大模型的上风紧张在哪些方面?

刘益东:紧张在支配本钱上。
我们的大模型已经能够做到用消费级显卡就能支配,对付企业客户而言,考虑到安全保障,这个本钱是可接管的。

同时用户要把大模型用好,和纯挚支配中间有一个gap,弥合这个gap对付我们来说便是要去契合地接入各种业务场景,设计交互友好的产品界面,我们做了很多工程性的事情,把整体的功能用大略易用的形态交付给客户。

36氪:这次展示的AI作诗、绘画等模型功能,看上去都很toC,蜜度是有做toC运用的操持吗?

刘益东:以前我们参加过很多展会,更多地是把比较专业的细节在屏幕上展示。
但参展者就会以为很陌生,这实在不利于普通客户的传播和理解。
以是从去年的WAIC开始我们就以普通用户可以理解的形式把我们的技能能力展现出来。

36氪:这次大会杨立昆也提到大措辞模型不是通往AGI的最优解,您对此是怎么看的?蜜度是否会跳脱出Transformer的路径去做新的考试测验?

刘益东:我们内部一贯在启动一些创新,不管是基于Transformer的还是新的技能路径。
那么我们的创新能不能超越Transformer?这实在并不是拍拍脑袋就能实现的,而是须要大量的科研投入。

欢迎互换