小米AI实验室六篇论文收录ICASSP2022多模态语音唤醒寻衅赛夺冠

同时，小米“自由说”系统在MISP （基于多模态信息的语音处理）寻衅赛中荣获多模态语音唤醒第一名和多模态语音识别第二名，并受邀在今年5月的环球会议上向工业界和学术界进行方案报告。

这也是小米在语音方向取得的第6个天下级比赛冠军。

ICASSP （International Conference on Acoustics, Speech and Signal Processing）即国际声学、语音与旗子暗记处理会议。

是IEEE主理的全天下最大的，也是最全面的旗子暗记处理及其运用方面的顶级会议，在国际上享有盛誉并具有广泛的学术影响力。

小米AI实验室被任命的论文涉及语音识别、语音合成、声学语音质量评价等诸多方向。

这次，小米语音、声学取得了精良的成绩，离不开小米工程师们在实际业务中踏实的技能积累，将实践中总结的技能进步向业界和学术界进行回馈，共同促进AI技能的繁荣和发展。

在语音领域，小米语音团队在2017年开始在学术顶会揭橥主要论文，并在TTS（语音合成）全面自研以及在合成的韵律、个性化、以及情绪这三个方面实现了重大的打破；智能生活助理小爱同学的声音定制效果、合成流畅度与稳定性、合成的情绪化都有显著提升。

同时，小米在语音唤醒和预演习方面进行了深入研究，提升了手机个性化语音唤醒和小米闻声的性能，降落了小爱误唤醒率，保障了语音唤醒的质量，受到ICASSP的审稿人的高度评价。

在声学领域，小米声学团队致力于AI声学技能的研究及工程落地，为小米手机及IoT全生态硬件产品打造业界领先的音频体验。
目前AI通话降噪、协同唤醒、协同放音、空间音频等技能已在手机、电视、小爱、耳机等60余款产品中落地。
4年来累计过审专利已达123项。

未来，小米将不断探索科技新高度，为大家带来更多黑科技，让更多人享受科技带来的美好生活。

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一韶光获知前沿科技动态

每期AI知识网