据悉,喜马拉雅“单田芳声音重现”等账号下上线的利用单田芳AI合成音所制作的专辑数量已经有100多张,总播放量超过1亿。
个中,有15张专辑播放量破百万,例如,《民国四大家族》播放量近730万,《十二金钱镖》播放量近700万,《卧虎藏龙全集》播放量超390万。

通过行业领先的TTS技能,喜马拉雅用AIGC引领长音频行业的内容生产变革,让内容生产提效。
与此同时,喜马拉雅还通过多项语音技能的加持,进一步提升用户的内容消费体验。

TTS技能完美复现单式评书

去年9月,在北京单田芳艺术传播有限任务公司授权下,喜马拉雅用TTS技能完美还原已逝的单田芳师长西席的声音,并首 次将单田芳师长西席的AI合成音全新演绎听众耳熟能详的经典之作。

用科技赋能文化喜马拉雅用AI技能让内容分娩提效 让内容体验增值

为了最大程度保留单老那苍劲、沙哑的独特嗓音以及情绪充足的评书腔调,喜马拉雅智能语音实验室对单田芳师长西席声音进行潜心探索和研发,通过自主设计单独的韵律提取模块,并将其融入到 HiTTS 技能框架中,不仅完美复现了单老苍劲、沙哑的“云遮月”式独特嗓音,就连他那情绪充足、起伏跌宕的腔调也一并保留了下来,让单老的AI合成音仿佛本尊再现。
单田芳师长西席之子单瑞林也评价表示,“听到TTS声音,心魂间猛然一阵,仿佛父亲又回到这个天下。

喜马拉雅已在TTS领域潜心研讨多年,并专门成立喜马拉雅智能语音实验室,长期专注于语音合成、识别、语音旗子暗记处理、编解码以及智能音效的研究和开拓。
喜马拉雅智能语音实验室的卢恒博士表示,针对小说的TTS系统和音色选取是喜马拉雅TTS的亮点与特色。
用真实自然的TTS音色演绎有声小说是非常难的,不同于普通的笔墨转语音,用TTS音色演绎小说须要学习小说中的抑扬抑扬、情绪表达、高下文关系,区分旁白和对白,并终极将作品完美演绎出来。
“喜马拉雅在这方面有着天然的上风。
在音频赛道耕耘多年后,喜马拉雅已经聚拢了海量有声书内容和浩瀚优 秀主播。
喜马拉雅智能语音实验室考试测验用各式的声音来表达不同的情绪、题材和频道,因而就有了更大的试验和发挥空间。

卢恒博士先容,喜马拉雅自研的TTS前端文本处理剖析模块已经能够高精度、全自动地对文本进行多音字识别、韵律预测和风格分类,并已开拓出可以实现多情绪、多风格、多语种声音的TTS技能模型,不仅可以演绎不同感情的笔墨,还可以自动区分旁白、对白,并支持英文,极大地丰富了TTS能表达的情绪和韵律。

目前,喜马拉雅已申请了20多项语音技能干系专利,个中有10多项TTS语音合成干系专利。
今年,还有两项语音技能成果先后被天下顶 尖学术会议“ 2022年IEEE国际音频、语音与旗子暗记处理会议”收录,展现了喜马拉雅强大的语音技能实力。

AIGC助力内容生产提效

通过行业领先的TTS技能,喜马拉雅成为音频领域AIGC的先行者。
除了评书,喜马拉雅多情绪、多风格、多语种声音的TTS技能模型已经广泛被利用于新闻、小说、财经专辑等多种内容的制作中。
喜马拉雅签约和制作了不同的TTS音色,来适配不同的内容、知足用户多样的需求。

例如,喜马拉雅原创TTS音色“喜晓峰”和“枪枪”已被运用于《听秦说》《 36 氪·氪金大事宜》《海清评财经|股票、债券及基金投资的一线参谋》等财经专辑内容中。
个中,“秦朔朋友圈”账号下《听秦说》专辑过去更新频率为每周一次,但在采取喜马拉雅TTS技能后,开始逐日更新。

“秦朔朋友圈”发起人、中国商业文明研究中央联席主任、及《听秦说》主播秦朔表示,过去没有利用喜马拉雅TTS技能时,须要真人录制专辑内容,耗时长,更新频率低,而利用TTS技能后,内容生产效率大幅提升,可以让“秦朔朋友圈”的文章即时音频更新,轻轻松松便实现了日更,专辑的播放量和互动数据都显著提升。

除此之外,新京报、环球时报、潇湘晨报、时期周报、外洋网、刺猬公社等数十家媒体也通过喜马拉雅多种标准普通话男声和女声的TTS音色上线了超过40张TTS专辑。

今年,喜马拉雅基于自研的TTS框架,采集头部主播“喜道公子”的真声打造的AI主播“喜小道”,与AI续写运用“彩云小梦”互助,打造了首 个从故事创作到演播均由AI完成的AI电台。

AIGC不仅助力喜马拉雅和内容创作者实现内容生产提效,推动创作者布局音频,实现转型升级,也给用户带来更丰富的内容。

AI技能助力内容体验增值

与此同时,喜马拉雅也通过TTS、ASR、语音旗子暗记处理算等多种AI技能进一步提升用户的内容消费体验。

目前,喜马拉雅已经与近百家网络平台和出版机构互助上线近6万本电子书,而TTS技能能为这些电子书实时天生TTS声音,让用户可以边听边看,从而为用户带来“听看一体”的内容做事。

近期,喜马拉雅又利用行业领先的自动语音识别技能(ASR)以及对齐算法,上线了全新版本的AI文稿功能,用户在收听喜马拉雅音频内容的时候,也可以在收听页面同步阅读相应的笔墨内容,享受“边听边看”、“听看一体“的内容消费体验。

全新上线的AI文稿功能,能有效识别无文稿声音内容,为其自动天生文稿;对付已经有原始文稿的声音内容,则采取超长音频与文本的对齐技能,将声音与文稿进行韶光戳对轨,从而在声音播放的同时,对相应笔墨进行同步高亮,实现声字同步,让用户能更便捷地享受边听边看的内容消费体验。
这不仅进一步提升用户体验,有利于增强用户粘性,也利用户能够在不同场景中,自由切换听和看两种形式,畅享喜马拉雅平台上的丰富内容,进一步拓展了喜马拉雅的多元化利用场景。

喜马拉雅还通过语音旗子暗记处理算法(SSP)率先在长音频领域带来智能音效,推出超重低音、剧院混响、清澈人声三种喜马拉雅专属音效,让用户可以为不同内容匹配不同音效,享受更加优质的收听体验。
接下来,喜马拉雅将上线更多的专属音效,为用户供应更加多样的收听选择。

喜马拉雅作为深受用户喜好的在线音频平台,始终坚持以科技赋能文化。
未来,喜马拉雅将连续让技能赋能创作者、做事用户,让内容生产提效,让内容体验增值,用技能加持声音、用声音做事生活。
(推广)