小米集团副总裁、集团技能委员会主席崔宝秋此前表示,小爱同学将从过去的语音助手升级为智能生活助手。
IT之家理解到,今日上午,小米创办人,董事长兼 CEO 雷军发文表示,小爱同学激活的设备数已经达到达 2.28 亿,月活已经达到 7840 万,累计唤醒 617 亿次,“小爱同学也成为目前行业内唯一一个拥有大规模落地场景的语音助手”。
以下为《雷军:小爱同学 5.0 背后的人工智能》全文:
在月初举办的 MIDC 开拓者大会上,我们发布了最新一代的小爱同学——小爱同学 5.0。全新的小爱同学带来了五大升级,覆盖了席卷影音娱乐、生活做事、信息查询、出行路况等 8 大领域 1400 + 技能,成为大家生活中离不开的智能生活助手。
从 2017 年 3 月 21 日,“小爱同学”第一次与大家见面,到现在仅仅 4 年韶光,小爱同学激活的设备数已经达到达 2.28 亿,月活已经达到 7840 万,累计唤醒 617 亿次,小爱同学也成为目前行业内唯一一个拥有大规模落地场景的语音助手。
新一代小爱同学 全新五大升级
新一代小爱同学的 5 大升级包括:全场景智能协同、对话式主动智能、定制化情绪声音、多模态领悟交互和聪慧学习好助手。
小爱同学 5.0 全场景智能协同
目前,拥有 5 件及以上连接小米 AIoT 平台的设备用户已达 560 万。随着用户家中的智能设备越来越多,利用和操作也变得更加繁芜。全场景智能协同便是让小爱同学 5.0 成为掌握家中浩瀚 IoT 设备的大脑,当你发出一条需求指令时,小爱同学会进行统一决策,家中多个设备进行协同合营,达到 “再多设备,都能化繁为简”的效果,是当之无愧的 “智能生活助手”。
想要达到智能协同,这个中须要办理的问题非常繁芜。不仅要根据设备间隔、生动状态、形态等综合条件判断,自主选择出设备能力最能知足当前语义需求的设备,乃至还须要预测用户潜在的设备掌握需求,应时主动的作出提醒和建议。
截止 2020 年 6 月,利用协同唤醒的总用户数已达 94.4 万,同时唤醒的拦截次数已达 9.4 亿。
小爱同学 5.0 对话式主动智能
有别于传统移动互联网 APP 或信息流被动预测用户的形式,对话式主动智能产品形态是小爱同学以自己的办法和节奏与用户互动沟通,像人一样发起问题来匆匆进对用户的理解。
主动对话本身便是高等智能的表示,它意味着人工智能不仅仅存在于与用户互动的短暂过程中,而是在更长的韶光内不断的进行思考和打算,须要像人一样,拥有 “影象”。
小爱同学 5.0 通过强大的自然措辞处理技能,主动学习个中关于用户的知识,从而建立影象。这有赖于小米自然措辞处理技能(MiNLP)的深厚积累,MiNLP 目前已迭代到 3.0 版本,支持 30 多个业务场景,日调用次数达 80 亿。
在影象的存储方面,小爱同学云端大脑会为用户建立多维度的个人画像,实现全设备个人信息互联互通。小爱同学的所有功能,会对内共享这些关于用户的 “影象”,每次交互结合个人画像进行打算,产生出面向用户个人的个性化结果。
小爱同学 5.0 定制化情绪声音
为了知足用户提出的,可以超过地理、韶光阻碍,随时随地就可以得到陪伴感的 “情绪诉求”,小爱同学定制声音项目应运而生。
定制化情绪声音的实现,不是仅依赖常规声音处理技能就可以做到的。首先须要能够对用户音频数据进行预处理。然后是提取关键声学特色,差异不同音色在频谱上的表现。末了是通过定制合成音库演习的根本模型,进行自适应学习,终极才能可实现只需少量的用户录音,就能取得很好的合成效果。
除了定制声音功能以外,小爱同学 5.0 针对粤语也进行了深度的优化,并在 8 月份开启了粤语在音箱上的内测。本月中旬,我们已正式启动在手机及电视上小爱同学粤语功能的内测,估量在月内,小爱同学粤语功能将陆续开放到所有音箱上。
小爱同学 5.0 聪慧学习好助手
小爱同学 5.0 将学习作为一个主要的升级模块,整合了海量的优质的 K12 网课资源,精选 1000 + 网课视频资源,与读书郎、义方教诲等 35 家优质资源方达成了互助,并拉通了电视 / 音箱 / 手机教诲会员同步。
课程表是学生学习中最基本的一个工具类需求。我们把课程表与小爱同学结合在一起,打造了一个拥有海内首发 AI 拍照导入课程功能等前辈人工智能技能加持的 AI 课程表。
其余一大工具,便是翻译。为了让翻译更高效、更精准,小爱同学团队在文本前处理模块进行了优化,包括基于措辞规则和模型的文本顺滑技能、领悟上文内容的实时文本纠错算法、基于多措辞预演习模型的实时语义断句算法等。
小爱同学 5.0 多模态领悟交互
为了让小爱同学与用户之间进行更自然的沟通,我们做了更智能的多模态领悟交互,可以通过声音、肢体措辞、信息载体(笔墨、图片、音频、视频)、环境等多种办法与智能设备进行互换。冲破了传统 PC 式的键盘输入和智好手机的点触式交互,定义了下一代智能产品和人的专属交互模式。
新一代小爱同学背后 是小米 AI 能力的长期积累
小米集团拥有非常丰富的业务线,包含了硬件产品、电商和新零售以及互联网业务。小米的人工智能不仅仅表示在小爱同学上,还拥有非常广泛的运用领域,比如打算机视觉技能、打算机语音技能和机器学习技能等。
经由这几年的努力,我们的 AI 已经建立了比较完全的能力图谱和小米的 AI 能力平台,在此根本上打造了小米的干系运用,包括智能相机、小爱同学、机器翻译等等。强大的智能硬件生态为 AI 能力的快速提升建立了根本,同时 AI 能力又反过来,全面赋能了小米各个业务线。
比如在打算机视觉技能方面,我们做了大量的事情,包括超级分辨率、文档模式 / OCR、邪术换天、邪术分身等。今年,我们的 HDR(高动态范围拍照)也助力小米 10 Pro / 至尊纪念版相机成功得到 DXOMARK 评测天下第一。
我们在打算机语音、机器学习等很多方面也都做了大量的事情,全体集团在人工智能领域的投入,可能远远超过大家的想象。截止 2019 年 12 月 31 日,小米集团共提交专利申请 33000 余件,个中 AI 领域专利申请数量已进入环球互联网企业第一阵营。包括端到端语音识别、就近唤醒、分布式放音、离线翻译等在内的多项技能处于行业一流水平。
同时,我们也在积极引入环球顶尖的研发人才,比如我们成功约请到了人工智能领域的顶尖专家 Daniel Povey 加入小米。
未来,小米的人工智能会进一步打造核心技能,推进各项 AI 技能的业务落地,给用户打造更好的体验。同时,也会更加的开放,连续加强和高档院校科研院及其企业的互助,将更多更好的 AI 技能开放给社会,为每一个人带来更美好的和智能的生活。