这项研究是与墨西哥普埃布拉国家天体物理学、光学和电子学研究所(INAOE)互助进行的,研究创造,最初针对人类措辞演习的人工智能模型可以作为一个出发点,用来演习针对动物互换的新系统。

干系成果已在打算措辞学、措辞资源和评估联合国际会议上公布。

\"大众通过利用最初在人类语音根本上演习的语音处理模型,我们的研究打开了一扇新窗口,让我们理解如何利用迄今为止在语音处理方面所取得的成果,开始理解狗叫声的细微差别,\公众马大打算机科学与工程系 Janice M. Jenkins 学院教授兼人工智能实验室主任Rada Mihalcea说。

\公众对付与我们共同生活在这个天下上的动物,我们还有很多不理解的地方。
人工智能的进步可以用来彻底改变我们对动物互换的理解,而我们的研究结果表明,我们大概不必从头开始\"大众。

密歇根大年夜学开拓的AI对象可以经由进程狗叫声分辨出其是否具有进击性

开拓能够剖析动物发声的人工智能模型的紧张障碍之一是缺少公开可用的数据。
虽然记录人类语音的资源和机会很多,但从动物身上网络此类数据却比较困难。

\公众动物的发声在逻辑上更难网络和记录,\"大众第一作者、马萨诸塞大学打算机科学与工程系博士生 Artem Abzaliev 说。
\公众它们必须在野外被动地记录下来,如果是家养宠物,则必须征得主人的赞许\"大众。

由于缺少可用数据,剖析狗发声的技能难以开拓,而现有的技能也因缺少演习材料而受到限定。
研究职员通过重新利用现有模型战胜了这些寻衅,该模型最初是为剖析人类语音而设计的。

这种方法使研究职员能够利用强大的模型,这些模型构成了我们本日利用的各种语音技能的支柱,包括语音到文本和措辞翻译。
这些模型经由演习,可以分辨出人类语音中的细微差别,如语调、腔调和口音,并将这些信息转换成打算机可以用来识别所说词语、识别说话人等的格式。

\"大众这些模型能够学习和编码人类措辞和语音中极其繁芜的模式,\"大众Abzaliev 说。
\公众我们想理解能否利用这种能力来辨别和解读狗叫声。
\公众

研究职员利用了74只不同品种、年事和性别的狗在各种情形下发出的声音数据集。
亨伯托-佩雷斯-埃斯皮诺萨(Humberto Pérez-Espinosa)是INAOE的互助者,他领导的团队卖力网络数据集。
然后,阿布扎利耶夫利用这些录音修正了一个机器学习模型--一种能识别大型数据集中模式的打算机算法。
该团队选择了一种名为 Wav2Vec2 的语音表示模型,该模型最初是在人类语音数据上演习出来的。

有了这个模型,研究职员就能天生从狗身上网络到的声音数据的表示,并阐明这些表示。
他们创造,Wav2Vec2 不仅在四项分类任务中取得了成功,而且其准确率高达 70%,超过了专门针对狗叫声数据演习的其他模型。

\公众这是首次将针对人类语音进行优化的技能用于帮助解码动物互换,\"大众Mihalcea 说。
\公众我们的研究结果表明,从人类语音中得出的声音和模式可以作为剖析和理解动物发声等其他声音的声学模式的根本。
\"大众

除了建立人类措辞模型作为剖析动物互换的有用工具--这将使生物学家、动物行为学家等受益之外,这项研究对动物福利也有主要意义。
研究职员说,理解狗发声的细微差别可以大大改进人类解读和回应狗的情绪和生理需求的办法,从而加强对它们的照顾,防止潜在的危险情形发生。