培植粤港澳大湾区,提升科技创新水平可谓是重中之重。作为环球科创领域的“当红炸子鸡”——人工智能(AI)家当在粤港澳大湾区的发展也备受重视。为此,近日,南方日报、南方家当智库就联合广州市社科院、广州市人工智能家当发展促进会等专业机构启动了“粤港澳大湾区AI家当深调研”。
根据操持,调研团队将深入一线、实地拜访过百家粤港澳大湾区的人工智能干系企业,从出行、零售、金融、教诲、医疗、互联网等诸多运用处景切入,对粤港澳大湾区AI家当的机遇与寻衅进行深度探访。
调研的第二站,我们来看看生活中无处不在的互联网如何借助AI变得更聪慧吧!
有没有一个旋律,存在在你深深的脑海里,但你却怎么也记不起歌名?现在,除了连续绞尽脑汁冒死回顾,你还有70%的几率可以通过“哼唱”旋律的办法找到它,纵然是方言歌曲也没什么问题。
目前,依托于音频指纹技能,部分用户可以通过音乐软件中的“智能识曲”功能找回“被遗忘”的歌曲,“在普通办公环境中,只要对动手机哼唱4秒旁边就能找到歌曲,精确识别率最高99.4%。”酷狗音乐智能技能卖力人见告,当下音乐软件中的“智能识曲”功能已基本成熟,未来AI+音乐还能帮助音乐公司提高曲库管理效率,降落用户的创作本钱和门槛,“让大家都有机会成为周杰伦、方文山。”
音频也有“指纹”密码,识曲最快只需0.8秒
伴随着互联网、大数据、云打算等领域的飞速发展,近年来人工智能在数字音乐运用方面开始了频繁的探索,许多优质功能也被逐一开拓了出来。在这之中,“听歌识曲”及“哼唱识曲”便是AI+音乐所打造出来的最具代表的功能之一。
“目前,音频指纹技能已经较为成熟,听歌识曲在实际利用时准确率约有85%。”据酷狗音乐智能技能卖力人谭建文先容,用户打开APP的“识曲”功能,让手机只管即便靠近正在播放的音源,后台就会迅速将该歌曲中的音频特色跟曲库中的歌曲进行匹配,均匀识别时长约6.9秒,无噪音或其他滋扰的情形下最快0.8秒就能完成识别。
而在“哼唱识曲”方面,正常办公室环境下用户只要“哼”约4秒就能完成识别并导出结果。然而,为担保结果足够准确,酷狗音乐App建议用户哼唱12秒以上,“并且整体音准最好有70%旁边。”该卖力人表示,哼唱时后台处理器会迅速将所唱曲调与3500万首曲库中的歌曲做匹配,识别准确度最高可达99.4%,纵然是方言歌曲也不在话下。
据理解,酷狗音乐会借助拾取技能对所收录的歌曲中包含的音频信息进行压缩处理,提取出个中最关键、最具区分度的信息点。如此一来,每当用户利用“识曲”功能时,App能够凭最少的信息量完成音频匹配。“每首歌的音频信息都有独特的‘指纹’密码,我们要做的便是快速筛选这些音频‘指纹’信息及歌词信息,并完成匹配和识别。”
然而,音频指纹技能也有一个天然的“仇敌”,那便是噪音。由于用户开启“哼唱识曲”或“听歌识曲”功能的环境多种多样,因此在设备识曲时很难避免噪声对识别准确率带来的悲观影响。目前,酷狗音乐自行开拓的“智能去噪”技能已能对部分现实环境中的噪音做平滑处理,但“净化”效率和效果仍待提升。对此,酷狗音乐正操持开拓AI智能环境识别等功能,未来根据环境的不同,为用户在识曲时供应不同的去噪方案:“比如在汽车站识曲,就能智能去除车流的噪音;在浴室识曲,能够智能去除反应等。”
根据喜好推举歌单,音乐软件也有“最强大脑”
除“智能识曲”外,“AI智能推歌”也是AI+音乐的核心运用之一。据先容,基于音频特色剖析技能以及音频特色推举模型,酷狗音乐可通过用户收藏的歌曲和平时的听歌喜好为用户智能推举“逐日歌单”:“一首歌里每每包括情绪、曲风、声学特色三类信息,把这个信息汇总成信息库,我们就能找到用户的喜好,并为他们智能推举歌单。”
在利用时创造,酷狗音乐的“逐日歌曲推举”功能每天会为用户推举30首歌曲,并根据他们的喜好差异智能筛选出古风、欢畅、摇滚、悬疑平分歧曲风的歌曲,“用户利用这个功能的频率越高、时长越长,推举也会越准确。”
然而,由于AI+音乐仍处于发展的低级阶段,各个音乐平台研发的智能推举技能“百花齐放”,行业内对付音频信息的分类方法等仍旧缺少一套统一的标准。“但不可否认的是,推举算法是AI+音乐主要的运用方向之一,今后随着行业的进步,规范也会逐步建立起来。”
未来“AI+音乐”让大家都是周杰伦、方文山?
只管目前AI+音乐正处于快速发展的阶段,但AI目前在音乐家当的运用仍旧要基于统计和深度学习技能,“逃不开模拟和统计模型”。谭建文表示,当下AI缺少“知识性”思维,在音乐创作能力和逻辑思考能力方面与人类仍有一定间隔。未来,随着技能的发展、成熟,AI不仅要高效完成“识曲”和“精准推举”,还应该具备“智能创作”的能力,赞助用户以更低的门槛及本钱完成音乐创作,真正实现“大家都能做原创”。
“‘AI智能作曲’是用户可以期待的功能。未来用户随机输入一段旋律或歌词,人工智能就可以根据词曲风格智能补足整首作品,或给用户供应修正建议,帮助他们学习创作技巧。”该卖力人表示,今后在AI的加持下,音乐平台将不仅仅具备“最佳听力”,能够快速识别音频信息并给予用户反馈,还有可能搭载上“最强大脑”,创作出全新的音乐风格和形式;许多因音乐学习、制作门槛过高而打消创作动机的用户也将得到新的机遇。“AI+音乐是一种趋势,只管还处于发展初期,但今后它的发展潜力确实不可小觑。”
【出品】南方家当智库
【策划】陈韩晖 卢轶
【统筹】程鹏 李劼 郜小平
【新媒体运营】刘静
【采写/视频】许隽
【作者】 许隽
【来源】 南方报业传媒集团南方+客户端 南方号~深度~南方家当智库