根据好看视频利用数据, 目前天生一个时长2分钟旁边的720p视频, 所需时长的中位数仅为2.5分钟;平台每天可以生产500到1000条视频,全体过程从热点创造到终极的视频天生完备无人化、自动化;此外,VidPress所天生的视频播放完成率比好看视频的大盘赶过15个百分点,一些热门视频已经有了85万的播放量,足见AI新闻视频深受不雅观众喜好。
用户输入图文内容后, 例如输入某条新闻事宜的链接,平台将基于NLP模型进行语义理解, 并通过主体模型聚合干系新闻素材,以及从同一主题干系新闻里抽取更多的素材及其语义表征,充分保障素材内容的丰富度和干系性。
紧接着,讲授词语音天生和素材深度挖掘同步启动。一方面,平台基于多种措辞模型对原文进行处理,自动天生一篇字数符合哀求且适宜视频呈现的讲授词,并通过百度笔墨转音频做事(TTS)合成讲授词语音,效果媲美播音员;与此同时, 平台会根据对原文的理解, 通过自有视频库和百度搜索引擎搜索,智能化聚合最新最适宜呈现的内容,并基于人脸识别、物体识别、视频内容理解等打算机视觉做事进一步解析和理解,自动剪切和精选视频素材。
上述两个步骤完成后,平台将基于讲授词音轨韶光轴和所聚合的媒体片段,进入音视频对齐剪辑过程。百度升级后的第二代韶光轴对齐算法,其关键在于选取出文本中的兴趣点, 再将媒体片段与兴趣点进行干系度打分,将优质媒体片段优先放入韶光轴,以此担保视频的整体不雅观感和用户兴趣的持续引发。当时间轴天生完毕之后,数据转交给渲染器,从而天生一个完成的视频,整合过程耗时可以担保在9分钟以内,极其高效。
上游新闻·重庆 顾立 演习生 玉浩