蜜度CTO刘益东AI技能成长的成果要让通俗人都能理解最前哨

编辑 | 邓咏仪

在今年的天下人工智能大会（WAIC）逛蜜度的展台，会有一种来到了做AIGC运用的To C企业的错觉，与会者可以体验用AI写诗、作画，并领取AI制作的明信片。

WAIC蜜度展厅。
图源：蜜度

这次，长年为政企供应措辞智能做事的蜜度在WAIC上一口气发布了三个垂直领域的大措辞模型：蜜巢知识问答与内容天生大措辞模型、蜜巢智能舆情剖析大措辞模型、智能校正领域大措辞模型“蜜度文修”。
这三款措辞大模型紧张为新闻出版、媒体采编、政府公函领域供应智能化的做事。

蜜度CTO刘益东AI技能成长的成果要让通俗人都能理解最前哨

蜜度CTO刘益东见告36氪，以前蜜度参加过不少展会，采纳的都是在屏幕上展示产品专业参数的形式。
从去年WAIC开始，蜜度开始用普通用户都能理解的形式呈现技能能力，不雅观众可以对AI技能进行现场体验。

他打了个比方：“我们的展台，想让爷爷奶奶辈也感想熏染到AI的智能便利。
好比大墨客杜甫常将写好的诗念给不识字的老婆婆听，以便普通易懂。
”

7月6日的WAIC开幕式上，“深度学习之父”杨立昆重申“LLM不会是那条通往人类智能的道路”。
这也让许多厂商跳脱出Transformer的框架，去做创新。

发布自研的行业基座大模型，是今年蜜度的目标。
刘益东以为，自研行业基座大模型是蜜度的方向：“下一个创造风口的可能就不是OpenAI，海内厂商要捉住机会。
”

以下是刘益东和36氪的对话：

先垂直，后通用

36氪：这次蜜度和友商们同台秀大模型肌肉，为此蜜度做了哪些准备？

刘益东：我以为这次WAIC大家会有一些同行竞争的压力，但更多地是抱着互换学习的态度。
虽然很多厂商都推出了大模型，但是聚焦的垂直领域是有差异的。
我以为作为企业，须要更多地思考我们的上风在哪里，以及怎么为客户和用户带来实用、便捷、高性价比的AI做事。

36氪：那关于这个问题，蜜度的思考结果是若何的？

刘益东：在过去的十多年韶光里，蜜度紧张做事的是政务、媒体、企奇迹单位的办公需求，也积累了一定规模的客户，以是我们接下来发力的点还是会从这些行业延伸，包括会逐步地触及教诲行业的B端客户。

我以为蜜度的上风首先在数据能力，在2017、2018年的时候我们已经把AI的一些能力通过产品赋能用户了，在大量高质量行业数据的根本上，蜜度能够更好地实现运用落地。

其次是客户履历的积累，我们对客户需求的认知和理解程度还是很高的，虽说现在方案仍须要风雅打磨，但至少现在我们已经有干系的根本，能在未来给客户供应“开箱即用”的成熟方案。

末了是蜜度对科研的投入，2019年公司成立了专门的科研机构“微热点研究院”，紧张用于与学界科研力量一起追踪前沿科技。

36氪：大会上蜜度先发了三个垂直领域的大模型，而不是一个通用的基座。

刘益东：是的，这次我们发布的几个模型是针对垂直领域的。

我们的目标是在今年下半年在已经发布的模型的根本上，去演习一个参数规模在千亿级的行业基座模型。
当然这个基座模型还是会方向于政务和媒体的场景。

36氪：先基于开源模型演习垂直领域的模型有若何的考虑？

刘益东：大模型领域的发展可以说这天月牙异，我们选择先做垂直领域的模型紧张是考虑了现实运用的需求。
由于基座模型的演习是一个漫长、投入大的过程，同时不是说一次就能得到很好的效果，而是要做很多方向的调度。
为了知足客户当下的需求，我们考虑先推出垂直领域的大模型，知足垂直行业运用的需求。

36氪：华为也有自己的“盘古大模型”，提出了垂直领域的模型办理方案，作为华为昇腾的客户，蜜度与华为会不会也形成竞争关系？

刘益东：在我的理解中，华为更多的是做一些底层根本举动步伐的事情，而我们的定位是偏中上层的运用。
全体AI生态不是说一个人就能把所有事都干完，大家各自都在做善于的事，以是我们一贯和华为都有良好的互助。

最难的是工程落地

36氪：ChatGPT带起的AI热潮也已经由客岁夜半年了，您以为算力、数据等哪些难点得到了一定的办理？哪些还是“卡脖子”问题？

刘益东：我以为算力、算法、数据，还有一些工程性的寻衅都是非常关键的成分。

先从算力讲起。
过去半年多的韶光里，各地的算力网络培植也很快。
比如上海的超算中央就在过去半年里供应给了我们很大的算力支持，实在培植的速率很快，并且它能够支持国产的异构算力，算力这个难点还是得到一定的办理。

接着是算法。
全体大模型开源生态在过去半年里发展得非常快。
最开始开源模型有千亿的参数，我们只能用小数据做试验。
后来更多的快速演习的框架面世，就能帮助我们仅用百卡的级别来演习一个百亿参数级别的模型。
以是通过半年的不雅观察和摸索，下半年我们具备了自主演习基座大模型的条件。

不过，在数据层面我们仍旧面临一些寻衅。
由于中文高质量的数据生态发展才几个月的韶光，当然这段韶光内各行各业都在建立高质量的数据演习集，个中一些因此开放的办法，我以为这是非常好的趋势。
如果办理了中文演习数据的问题，至少从大模型的算力、算法和数据三个角度而言，基本上不会有太多问题。

而最大的寻衅来源于工程落地。
大模型前期的落地步骤包括用户运用，本钱很高。
如何让大模型在内部落地，并且让客户高效利用好，这是蜜度这半年来在思考和在履行的。
目前我们已经做到把蜜度的大措辞模型支配在消费级的显卡上，比如说国产的华为昇腾NPU卡。

AI技能发展的成果要让普通人都能理解

36氪：蜜度大模型的上风紧张在哪些方面？

刘益东：紧张在支配本钱上。
我们的大模型已经能够做到用消费级显卡就能支配，对付企业客户而言，考虑到安全保障，这个本钱是可接管的。

同时用户要把大模型用好，和纯挚支配中间有一个gap，弥合这个gap对付我们来说便是要去契合地接入各种业务场景，设计交互友好的产品界面，我们做了很多工程性的事情，把整体的功能用大略易用的形态交付给客户。

36氪：这次展示的AI作诗、绘画等模型功能，看上去都很toC，蜜度是有做toC运用的操持吗？

刘益东：以前我们参加过很多展会，更多地是把比较专业的细节在屏幕上展示。
但参展者就会以为很陌生，这实在不利于普通客户的传播和理解。
以是从去年的WAIC开始我们就以普通用户可以理解的形式把我们的技能能力展现出来。

36氪：这次大会杨立昆也提到大措辞模型不是通往AGI的最优解，您对此是怎么看的？蜜度是否会跳脱出Transformer的路径去做新的考试测验？

刘益东：我们内部一贯在启动一些创新，不管是基于Transformer的还是新的技能路径。
那么我们的创新能不能超越Transformer？这实在并不是拍拍脑袋就能实现的，而是须要大量的科研投入。

欢迎互换

每期AI知识网

蜜度CTO刘益东AI技能成长的成果要让通俗人都能理解最前哨

上海徐汇AI帮你写起诉书法院高科技让社会年夜众直呼惊喜

AI写教案效率翻倍这5款对象让师长教师的天天都充满创造力

每期AI知识网

蜜度CTO刘益东AI技能成长的成果要让通俗人都能理解 最前哨

上海徐汇AI帮你写起诉书法院高科技让社会年夜众直呼惊喜

AI写教案效率翻倍这5款对象让师长教师的天天都充满创造力

蜜度CTO刘益东AI技能成长的成果要让通俗人都能理解最前哨