【环球网宣布 李文瑶】3月28日,钉钉 AI 助理宣告升级,上线图片理解、文档速读、事情流等产品能力,探索多模态、长文本与 RPA 技能在 AI 运用的落地。
基于阿里通义千问大模型,升级后的钉钉 AI 助理拥有更强的视觉推理能力和长文本速读能力。
目前,用户在钉钉 IM 框或点击邪术棒按钮进入 AI 助理对话框,发送长文件、在线文档、网页链接、视频内容,即可根据内容识人、识地点、剖析、答题、翻译、择要、提取笔墨,乃至可以通过多轮交互进一步做智能问答。

详细来看,基于通义千问 Qwen-VL-Max 视觉理解模型,钉钉 AI 助理能够准确描述和识别图片信息,并根据图片进行信息推理、扩展创作、笔墨提取、翻译等,相称于一个全能的“图片小百科”。

同时,通义千问 Qwen-VL-Max 拥有更强的视觉推理和中文理解能力。
此外,AI 助理也支持视频内容的速读。
发送给 AI 助理的短视频、直播切片或培训视频可以被快速“不雅观看”, AI 助理会根据视频内容天生字幕,提取关键词,并天生一份智能择要,对付最高 2GB 的视频内容,仅需 3 分钟即可完成智能解读。

基于通义千问大模型,钉钉 AI 助理可以快速阅读本地文件如 Word、PDF、PPT、Excel 等、钉钉文档、网页链接等多种格式文件,轻松解析各种学术论文、产品手册、利用教程、数据表格、新闻宣布、多国措辞的图书等。

钉钉 AI 功能多模态进级  能根据图片识人翻译创作多轮问答

目前,随着 OpenAI 带火 Agent(智能体),大模型融入自动化技能成为当前最具共识的方向之一。
今年1月,钉钉 AI 助理正式上线,企业和个人 AI 助理已进入到事情和生产力场景中。
为让 AI 助理可以完成一系列更繁芜的任务,钉钉 AI 助理上线了事情流能力。

事情流是 AI Agent 的一种进阶玩法,不仅可以在创建时对 AI 实行任务的流程进行拆解和编排,使得 AI 助理可以主动接管完成相应操作,还能够打通外部的系统数据和 API 能力,进一步扩展了它的行动能力,比如搭建能自动写脚本并天生视频的创作 AI 助理。

为降落用户的利用门槛,钉钉官方还供应了多种事情流模板。
已有企业利用事情流创建了门店信息网络助理,将用户反馈自动化整理,并存储到一张钉钉多维表中,帮助员工节约噜苏的韶光;个人用户也通过连接微博 API,创建了自动追踪热点并撰写文章的助理,一个指令就能批量实行,大幅提升内容生产的效率。

目前,用户可在钉钉 APP 或 PC 客户端直策应用 AI 助理的各项功能,包括多模态、长文本和事情流。