机器之心编辑部

在云打算和AI技能的帮助下,视频事情正在从「刀耕火种」走向「精耕细作」。

从手机上的短视频,到智能电视中的新闻宣布,如今互联网上 80% 的流量来自于视频内容。
但你可能还不知道,如今很多盛行的视频内容都是有 AI 参与,乃至完备是由 AI 自动天生的。

在视频制作的全流程加入 AI,已经成为越来越多媒体和公司的选择,而提到海内的 AI 技能,自然而然就会让人想到百度。

云智一体全场景视频技能百度智能视频云怎么玩转视频营业全流程

在本周四的一场活动中,百度首次揭开了基于 AI 原生架构的「智能视频云 3.0 全景图」。
与此同时,其领先的视频处理技能又得到了一次大规模更新。

百度的智能视频云 3.0,现在已可以在云智技能一体化、产品平台化、运用处景化三个层面全面赋能视频业务的全部流程。

智能视频云 3.0:让 AI 覆盖视频业务所有环节

百度首次揭开了智能视频云 3.0 的全景图:

百度已构建起完全的云智一体的智能视频技能 + 平台。

智能视频云 3.0 将百度「云智一体」的上风与视频技能全面领悟,为行业供应了前辈、全面的云与 AI 的视频技能能力、实用的视频创作分发平台和视联网感知平台,以及覆盖全场景的智能视频技能方案。

云智一体,是智能视频云 3.0 的核心亮点。
在技能发展趋势和行业业务的急迫需求下,「智」——AI 技能可以实现对视频中的各种信息元素进行多模态剖析、理解、天生,以云、边、端一体为根本的「云」打算则成为「智」强有力的输出载体,二者结合、左右开弓,不仅能够更好地适应全视频时期提出的哀求,也成为干系家当实践的新思路。

在新近升级的智能视频云 3.0 上,百度开放了十余个云智产品组件和两大面向场景的平台。
个中,创作分发平台面向泛媒体和泛互联网场景,可以供应端到端一站式的视频做事。
该平台覆盖了视频分发的全流程,包括各种办法的视频接入,视频生产、内容处理、审核剖析等等,末了还可以通过个性化推举实现高效率分发。

创作分发平台的核心是事情流和媒体资源管理,通过媒资构造化处理和多模态精准搜索,人们可以利用这一工具将资源利用率提升 40%,最大程度地发挥内容的代价。

同时,这一平台也降落了 AI 技能的利用门槛,创作分发平台供应了一套可视化掌握台,可以大略灵巧的配置编排视频的处理流程,应对个性化业务需求,并让自身产品适配移动化、多终端、多形态业务场景。

这些技能到底有多好用?据先容,百度供应的智能小视频办理方案,涵盖视频管理、存储、转码、审核、抽帧、去重、标签化、分发加速、个性化推举、大数据等功能,只需一个人就可以上线自己的视频业务。
百度还操持在今年二季度对创作分发平台进行再升级,将百家号中现有的视频生产能力开放出来,面向所有创作者赋能。

在工业领域,打算机视觉的运用面向视频监控和目标识别居多,百度智能云的视联网感知平台,紧张面向这些家当视频运用处景。
它的核心是对视频端设备和泛视频数据流的统一连接、剖析和管理,可以为企业生产、园区管理、城市和社会管理等事情供应平台化支撑。

「通过百度智能视频云边端领悟根本与云智一体的架构设计,智能、开放的产品理念和平台,我们终极可以帮助互助伙伴实现面向生产、掌握和管理等场景的通用化根本平台,」百度智能云智能视频总经理连林江说道。
「我们的平台能为家当视频运用供应一个视频数据的接入、管理、智能化剖析的运行环境、云智一体的开拓环境,还可以通过运用能力平台的开放催生出新的商业模式。

基于全流程的云智技能产品能力和两大平台,人们可以在百度智能视频云上实现丰富且完全的能力组合,进行新功能的开拓,并将之集成为运用进行支配。

多模态视频生产的「终极形态」

在最常被人们打仗到的消费互联网领域里,百度智能云的技能可以帮助实现内容生产的自动化与智能化。
从智能视频云 1.0 供应视频传输能力,到 2.0 版智能生产、智能连接、智能理解三项升级,在最新的 3.0 版中,百度已经实现了全链条的 AI 视频处理能力。
这样的智能化紧张包含机器学习对视频内容的剖析理解、生产和交互等。

「我们创造,多模态 AI 技能已经进入了实践阶段。
在视频中,字幕和声音可以让机器更好地理解视频内容。
支持增强的理解能力。
」百度视觉技能部总监丁二锐表示。

在面对大量数据时,如何让机器准确剖析出视频内容?基于百度自研的业界最大多元异构知识图谱,你可以链接 5500 亿海量知识对视频内容进行整合剖析。

通过联合视觉剖析、语音识别、文本理解等多模态的内容,AI 算法可以更准确地理解视频内容并进行相应地算法推理。
「我们创造,结合知识图谱增强之后,视频 AI 的自动标签的召回率比之前纯挚通过多模态的形式提升了 140%,大幅度地提升了视频的编目、分类效果。
」丁二锐说道。

此外,在视频模态自身的理解中,百度也引入了目前 AI 领域前沿的超大规模预演习模型,其支持有监督数据、无监督数据的稠浊演习。
在算力有限的情形下,你可以利用压缩工具库 PaddleSlim 对模型进行压缩、蒸馏,帮助开拓者量化、适配不同场景的模型。

在视频智能生产上,百度视频云可以通过图文资讯、数据、图集等多种内容载体向短视频进行转换,并基于知识图谱对视频从构造化数据、事宜脉络、以及知识理解三种角度上进行剖析,实现创新的视频生产。
末了在视频的交互与天生上,全新构建的交互与天生 AI 能力中,基于元学习 - 迁移学习的视频天生技能可根据需求快速定制出不同风格的高质量视频。

「多模态视频天生技能的集大成者便是数字人,」丁二锐说道。
「一个好的数字人须要实现四种方面的能力:丰富的形象,自然的交互,同时能够高效产出内容,还须要适应多种不同的业务形态。

数字人虚拟主播「小 C」

AR 互动视频,数字人等技能是视频领域未来的方向。
利用百度智能视频技能中虚拟数字人形象天生、RNN 实时语音合成等技能,可以很快制造出个性化的虚拟形象为我们讲述故事、播报新闻。
这些虚拟主持人可以 24 小时连续不间断地向人们播报新闻,形象生动、交互自然。

百度智能云与央视网互助打造了人工智能编辑部,在中台的体系根本上打造了包含采编发的人工智能编辑部实体的业务+线上流程的全流程逻辑。
构建了大量创新运用,包括面向消费者的「帮你找」功能,帮助用户和采编职员利用知识图谱找到干系素材。

在大阅兵、两会等热点事宜中,百度的数字人形象越来越多地涌如今宣布节目中。
5 月 4 日晚,在中心广播电视总台《奋斗正青春——2021 年五四青年节特殊节目》中,来自百度的 AI 虚拟主持人晓央亮相五四晚会,吸引了人们的关注。

幽美的形象,自然的动作,让晓央给人留下了很好的印象。
在「她」精彩表现的背后,是百度数字人产品采取的影视级的 3D 制作技能。
在担保模型风雅度的根本上,对面部特色、表情管理、体态管理进行了深入的研究。

为理解决传统影视技能生产的数字人表情不足生动、动作不足自然的问题,百度通过 AI 技能对人像驱动绑定调优,并利用了 4D 扫描技能,采集了海量表情演习数据,实现了端到真个面部预测,基于语音合成、真人语音的口型天生准确度超过 98.5%。

除了 3D 数字人,百度智能云提还供了其他类型风格的数字人,并在业内第一个把这一技能做到「工业级运用」:针对 2D 数字人,只须要一段播音员 5 分钟的视频资料,你就可以定制出一个全新的数字人,又可以通过静态图片对其进行换脸,实现多种个性化定制。

比拟真度和个性化更主要的是,这样的虚拟人可以支持多种运用处景。
百度智能云数字人支持文本驱动、语音驱动、指令掌握、真人驱动等驱动办法,也可以在任意多种驱动办法间的实时稠浊。
这样的技能在提升驱动效果的同时,有效降落了利用门槛和利用本钱。

百度智能云基于不同驱动办法的多模态视频生产能力,已被广泛运用在广电、金融、电商、教诲等行业,直播、短视频、对客做事等场景中。

在金融行业,图文之外的内容需求正在不断增长。
百度智能云可以供应底层的信息获取,以及数据处理能力,对海量视频内容进行标签、索引化,终极将剖析结果可视化,做到图文视频的高效传播。

在体育领域中,人们会关注各种比赛中的高光时候,百度智能云的算法可以从赛前的历史的数据、知识图谱检索做起,自动在比赛中展现干系内容,天生比赛精彩集锦的短视频。

聚焦家当智能转型的痛点

「通过对视频内容的构造化处理,我们可以大幅度地提高事情效率。
」百度集团副总裁侯震宇在活动中表示。
「视频作为人类最随意马虎理解、最易处理的媒体形态,不仅在娱乐领域,在很多行业业务中也已成为了完成任务的主要数据来源。
这意味着在家当互联网中,我们也须要一整套的方案。

百度集团副总裁侯震宇在「云智技能论坛 - 智能视频专场」活动中。

在面向业务的场景中,视频技能供应的是「把物理天下数字化」的能力,将视频转换为语义化的信息,用机器的自动化感知终极做出决策,对付 AI 技能来说,构造化的数据意味着生产力。

但在机器学习技能落地的过程中,人们每每会面临端侧算力有限,不同型号硬件适配困难,以及繁芜的业务需求。
很多企业希望打造云智一体的平台处理视频内容,这须要产生视频,加工,传输和构造化处理,终极进行理解和利用。

在智能视频云 3.0 中,视联网感知平台聚焦家当级视频通过信息获取对多种业务进行决策的特性,通过智能端多场景覆盖下的 200 余种运用处景,一站式、低数据、快速定制能力的 EasyDL 算子生产技能,与云边端硬件深度领悟,供应了具有秒级告警能力的最优云智一体架构,使平台形成模块化,并开放接口做事,实现了快速对接构建,提高了平台资源配置管理的效率。

百度既可以供应智能硬件、视频处理能力和云算力,也供应视频分发处理能力,而在运用商城中,人们还可以找到各种实用化的 AI 算法。
在用户运用 AI 技能一段韶光后,通过数据和实践得到的履历也可以沉淀下来,通过 EasyDL 开拓出 AI 算子,做事于其他机构。

在活动现场,来自宜昌市点军区和杭州星犀科技等互助伙伴分享了与百度智能视频云互助的案例。
在百度智能视频技能的助力下,宜昌市点军区在公共卫生、村落庄振兴、基层医疗、环境保护等方面为市民们带来了更多智能化的做事。
而通过百度智能视频云 PaaS 能力与云犀直播 SaaS 运用的结合,云犀直播办理了零售品牌自播实行门槛高、门店直播运营力缺少的关键问题。

「云」加持的画质体验

百度智能视频云的视频分发根本举动步伐 CDN 在环球已拥有超过 1000 个节点,具备超过 100T 的带宽储备。
在智能视频云 3.0 架构中,云能力对各种业务中视频本身的质量进行了提升。

百度提出的「智能编解码技能」BD265 通过深度学习网络来提取视频的体征,天生智能的编码参数,实现降落码率同时,提高主不雅观的视频体验和质量;百度自行研发了 60 多种算法,采取了多层并行的架构,在视频质量、编码速率和编码码率取得了优化解,可以在码率上均匀节省 20%-30%。

质感超清技能和产品则实现了创新性的视频增强办理方案,采取画质修复和色彩增强,运用了去噪、去划痕、上色、画质增强、超分辨率、SDR to HDR 等十几种算子,适配不同视频类型和场景,带来了视频画质的提升和超高清内容的转换,让视频体验更上一层楼。
百度智感超清的视频处理技能已经运用帮助央视电影频道等完成了许多老旧电影的修复、换新,比较人工处理效率提升了十倍以上。

百度的 SDR 转 HDR 的效果,可以看到颜色、亮度、细节等均有提升,这种技能支持 BT2020 色域、10bit 的位深。

在活动中,百度智能云还展示了实时音视频通讯的领先技能。
通过 AI 算法对高下行链路的智能预测,基于神经网络的路由方案和 WHIP 协议等技能,百度可以实现端到端即时通讯 200ms 以内的稳定延时。

而智能视频云中的 All in one SDK,可以面向不同业务场景供应矩阵能力,涵盖视频殊效、短视频、互动直播、播放器、增强超分等。

「我们不仅须要用云做事来办理多样化视频端设备的接入、算力的云边端承载和调度、快速传输和处理,也须要智能化地办理视频内容的构造化解析、场景化感知、语义化理解、智能化决策,」连林江说道。
「我们正处在全面视频化,全面向数字化、智能化转型的过程中。

百度是迄今海内唯一可供应从芯片设计到深度学习框架及运用层面全栈式 AI 能力的公司,它供应的根本举动步伐包括人工智能芯片、深度学习框架、核心人工智能能力及开放式人工智能平台。

这种能力已经为它带来了独占的竞争上风:根据 IDC 的数据,其在人体识别、图像视频、自然措辞处理等领域的市场份额持续保持第一。
百度仲春份公布的 2020 年财报数据显示,去年第四季度百度智能云营收同比增长了 67%。

进入增长快车道的百度,正在以自己领先的 AI 技能能力深入各行各业,为家当智能化升级带来新的机遇。