量子位 | "大众年夜众号 QbitAI
百模大战之后,大伙儿或许有个共识:
现在不缺大模型,缺的是怎么更好地把大模型用起来的方法。
有个现成的例子是,印象条记一贯被很多知识事情者当本钱身的“第二大脑”来用,在AIGC时期,用户看到了它更智能的改变。
实在早在2018年,印象条记就在AIGC的领域里开启了自己的摸爬滚打,几年下来,积累了不少履历和思考。
在本次中国AIGC家当峰会上,印象条记董事长兼CEO唐毅从知识管理的角度,分享了印象条记在AIGC领域,从技能到运用和产品的所见所闻、所思所感。
为了完全表示唐毅的思考,在不改变原意的根本上,量子位对演讲内容进行了编辑整理,希望能给你带来更多启示。
中国AIGC家当峰会是由量子位主理的行业峰会,20位家现代表与会谈论。线下参会不雅观众近千人,线上直播不雅观众300万,得到了主流媒体的广泛关注与宣布。
话题要点模型算法进展缓慢,算力投入与收益不成比例;公域数据穷尽,合成数据利用导致模型输出效果低落;小型化、垂直化的模型可以更高效地处理问题;强调了AI交付和模型之间的中间层——复合AI系统的主要性;AIGC产品的交互不是绝对的LUI(措辞用户界面)或者CUI(对话式用户界面);……以下为唐毅演讲全文:
大量利用合成数据导致模型输出效果低落大家下午好,我是印象条记唐毅,我本日演讲的题目是《用AI驱动的第二大脑实现增强人生》。
针对AIGC技能,我认为从技能到模型、算法、实践和运用的一系列垂直和落地的思考是非常主要的。以是,本日我从知识管理的角度,分享一下印象条记从技能到运用和产品的一些想法。
首先大略先容一下印象条记,它源于硅谷的一款叫Evernote的产品。
一贯以来,印象条记的愿景便是成为知识人群的第二大脑。这使得我们的思考一贯环绕着“知识场景”和“大脑的关键功能”。
本日我会从AI驱动印象条记系列产品,在内容理解、聪慧提炼、个人知识积累和公域知识获取等知识管理的场景中的实践履历,来做分享。
印象条记对AIGC的研发和实践早在2018年完成海内公司独立重组时就开始了。正式独立之后,我们首先更多地用了supervise learning的办法来做NLP,同时也开始启动了自己的小规模模型演习。
早在2023年3月,我们就已经开始利用自己的垂直专有模型驱动自己的AI产品,并将功能落地在旗下的软件和智能硬件产品。
由于印象条记在海内市场较早地启动了AIGC的全面实践,我们也积累了更多的履历和更深入的思考。
在我们看来,AIGC的创造还处在比较早期的阶段,对人类社会的影响也才刚刚开始,但现阶段,关于大趋势和方向性的思考更是必不可少的。
首先,比较算力的发展和模型规模的扩大发展,模型算法的进展却是相对缓慢的。
同时,到现在为止,算力的投入和收益是不成比例的,我相信真正对家当经济产生深远影响的技能,终极总的回报ROI要达到正向才可以。
另一个对付基座模型的寻衅是,在基座模型演习中,或许不一定每位在座的朋友都赞许。
我们看到一个征象,在模型演习中,随着公域数据的逐渐穷尽,合成数据被大量加入利用,这也会直接导致模型输出效果低落。
有寻衅也有机遇,我们看到,特天命据的优化在模型能力提升中的浸染、模型的小型化趋势、小规模模型能力的持续提升在AI产品交付效果的提升中都起着越来越关键的浸染。
强调“复合AI系统”观点谈到AI交付,印象条记是既做工具又做模型的厂商,在垂直整合的过程中,我们创造,由于我们采取印象专有大模型直接手事用户,用户可以对模型的效果和性能有着迅速和直不雅观的感想熏染,从而对背后的演习和调优过程给予直接有效的反馈。
而另一方面,AI产品的交付又远远不是仅仅将模型能力大略直接地交付到用户面前。
另一个显著的趋势是,小型化、垂直化的模型可以更高效地处理问题。在行业日益追求模型效率化的过程中,数据对模型质量和交付质量的影响在提升,对算力的需求反而不才降。
基于这些趋势和我们的实践履历,我想强调“复合AI系统”的观点,这是在AI产品交付和大模型本身之间的一个非常关键的运用思考点和架构设计点。
从不同的论文中我们也可以看到相似不雅观点——系统性思维下的模型演习、调优,以及与全体AI系统其它组成部分的有机组合,是现在AIGC运用的一个主要思考角度。
不同AI系统须要不同角度的思考,印象条记关于“复合AI系统”的思考紧张有以下几点:
第一,我们的模型采取稠浊支配策略,以专有模型驱动紧张用户做事和交互场景,模型本身具有路由和任务判断能力,同时也具备质量判断和云端一体的路由判断能力。
第二,我们对公域和私域数据的区分处理和保护管理有独特的系统和严密的规则。
第三,智能代理本身的功能是阵列式的,在关键节点剖析用户的意图、做任务的拆解,末了还要系统化地吸收用户反馈的过程。
模型:印象大模型是高效率、轻量化的专有模型,在知识场景中有着独特的和精良的性能表现。印象大模型端、云支配一体化,并具备一个主要的性能——能够根据意图判断和选择哪一个稠浊支配中的模型会有更好的处理的效果,也能判断和剖析任务本身并在云或端模型中进行选择。数据:严格区分管理公、私域数据,确保模型演习和AI产品交付中的用户数据隐私保护。Agent:在稠浊支配策略下,模块化的Agent阵列能够真正有效地判断用户意图并根据拆解的任务步骤分步实行任务。“复合AI系统”超越AIGC运用单一模型驱动的思考办法,而在此系统下设计一款成功的AI运用也须要考虑不同的成分,这也是印象条记在AI产品的打造中比较独特的体会。
首先,我们须要非常明确地剖析和判断出这款运用的准确利用场景。
同时,你的AI复合系统如何驱动这个产品给用户进行交付也十分关键。
对此,也有两个主要思考点。
一个是最得当的AI运用载体在哪——是在云端?在移动端?在某一个第三方平台?还是GPTs或插件?不用的载体在不同的场景和事情流中有着不同的浸染。
另一个是作甚最适宜的交互——自然措辞交互还是传统GUI交互?
提倡用直觉性的办法进行交互设计我们提倡用符合用户直觉性的办法进行交互设计,利用户用到AI功能和AI产品的时候是一种最自然的选择和体验。
因此产品的交互不是绝对的LUI或者CUI——例如在纯粹LUI或CUI的交互中,它虽然更自由、更开放,但完备开放的对话窗口也会增加用户的焦虑感 ——用户会停在那里不知道该做什么。
以是产品中既该当有完备开放的交互窗口,也该当有开放交互和传统的GUI相辅相成的Copilot性子的交互设计,同时也该当有降落用户焦虑感的传统限定性菜单处理交互式设计。
因此,在一个“复合AI系统”下打造AI超级运用时,我们认为除了AI系统思维之外,数据、用户、场景、载体、交互等关键的要素是须要非常慎重考虑的关键点。
回到印象条记的实践,我们通过自有模型的稠浊支配,比较早地进行了全面的布局和落地,推出了多种方向的功能:
内容天生与搜索、语义性搜索、大文件理解、多文件理解、与上万篇条记的私人对话等等。
通过逐步实践,我们总结出了一些令我们感到愉快的方法和得到了一些较为满意的结果。
“印象AI”的推出,对新用户的增长、用户留存和商业化转化的驱动效果都非常显著。
呼应我在本日演讲开始提到的不雅观点——作为AI从业者,对付核心技能、产品策略、市场投入等方面的实践的考验,终极总要能够回到对ROI的结果的衡量上来。
目前,印象条记旗下全系列的软件和智能硬件产品都已经在印象大模型的驱动下,完成了AI功能和产品的落地交付。
末了,我想说的是,在AI能力的加持下,印象条记希望能够帮助用户智能汇聚信息、高效阅读内容并接管知识、赞助灵感记录与创作、自动完成知识整理与提炼,让印象条记和印象AI为您增强人生,成为您真正的“第二大脑”。
感激大家!
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一韶光获知前沿科技动态