深度语音系统是基于深度神经网络构建的文本转语音系统。在发出“人声”之前,该系统须要韶光学习录音素材中的数据。第二版的深度语音系统的学习韶光须要90分钟,第三版则把这个韶光缩短到了30分钟,而现在,最新版的深度语音系统“克隆”人声仅须要几秒钟。不仅如此,该系统能够实现声音性别转换,比如将女性的声音转换为男性的声音;还能实现口音转化,如将普通话转化为地方口音。
或许在将来,各种角色扮演游戏中每个人的角色都能够发出和自己一样的声音了,让你有更好的游戏体验;或许父母可以让AI用自己的声音给孩子读睡前故事。但也有人会担忧,AI模拟人声过于逼真了,我们未来会受到更多假新闻的轰炸,比如有人用AI模拟某个公众年夜世人物的声音,通报假。
而且,这样一来,各种语音锁还安全吗?