原创:HyperAI超神经

关键词:声音识别 动物AI 机器学习 深度学习

米兰大学的研究团队在期刊《动物福利》上发布了论文《猫在不同环境中叫声的自动分类》。

他们通过音频旗子暗记处理和模式识别算法,实现了对猫叫声的自动分类。
此外,团队还开放了一个包含 440 段由 21 只猫网络的叫声数据集。

米兰大年夜学宣告论文与猫咪叫声数据集分类喵喵叫

网络二十一只猫,在三种状态的喵喵叫

猫,一贯以来都是最受欢迎和喜好的家庭宠物之一,通过对它们的行为、各种研究加强对猫的全面理解。

研究团队展开的这项研究,希望能够找出猫在几个常见环境下的叫声是否存在共性和规律,能通过机器学习的办法,找到这些规律,以理解猫的行为意图或生理活动。

他们选择了 10 只缅因猫和 11 只英国短毛猫两个品种共二十一只猫,仔细记录下它们的性别、绝育情形。

英国短毛猫-蓝猫

缅因猫

喵喵叫数据集

发布机构:米兰大学打算机系

包含数量:440 段音频

数据格式:wav

数据大小:20 MB

下载地址:

https://openbayes.com/console/openbayes/datasets/cxuvZ3QDu2S/

数据集收录了它们三种环境状态下的叫声,分别是:被抚摸时、陌生环境、喂食前,并严格担保每只猫在三种环境中的各种变量。

比如在收录猫咪在陌生环境中的叫声前,会让主人陪伴猫咪在环境中共处至少 30 分钟,以免引发它们的感情颠簸。
在担保猫咪感情稳定后,主人离开当前环境,收录猫咪独处的十分钟里的叫声。

在数据网络过程中,还须要只管即便减少房屋、家具装饰等对收音的影响,团队还测试了各种收音设备,包括宠物穿着设备,确保收音质量。

图为受试猫猫佩戴研究团队挑选的收音设备

图为受试猫猫佩戴研究团队挑选的收音设备

基于声音文件,研究团队提取了两组声学参数,即梅尔频率倒谱系数(MFCC)和时序特色。
用这些参数利用基于有向无环图平分类方案,将问题空间进行分类。

研究团队共利用了五种分类方案:DAG-HMM(有向无环图-隐式马尔科夫)、class-specific HMMs, universal HMM 、SVM 支持向量机和ESN 反应状态网络(Echo State Network )五种分类方法。

实验结果创造 DAG-HMM(有向无环图-隐式马尔科夫)的识别效果最佳。
DAG-HMM 对三种状态的分类识别效果,如下:

结果显示 GAG-HMM 方法对三种状态的猫叫声,都有着很高的识别率。
尤其对付等待喂食状态下的声音,有着 100% 的准确识别率。

这一研究结果让团队大受鼓舞,实验证明了猫叫声是可以被有效分类的。
他们操持下一步的研究将考试测验结合猫咪的身体动作,建立剖析模型,连续剖析猫咪的感情特色。

读论文,下载数据集,就能理解猫?

阅读完全论文:

https://www.mdpi.com/2076-2615/9/8/543/htm

访问数据集:

https://openbayes.com/console/openbayes/datasets/cxuvZ3QDu2S/

我们在年初的一篇文章《铲屎官福音:汪星人和喵星人的小感情,AI 可以识别了》先容过目前市情上一些识别宠物感情的技能和产品。
也提及,动物的表达体系十分繁芜,声音只是其措辞的一部分,绝大多数动物还会依赖肢体动作、气味乃至生物激素,进行彼此之间的互换。

以是,要想搞懂它们的感情,人工智能的确有办法。
但是我们建议主人在养育过程中,多多存心关注小主子的表现与反应,更能体会到它们真实的感情和需求噢~