8月31日, AI独角兽公司MiniMax正式推出视频天生模型"video-1"。据悉,这款模型拥有压缩率高、文本相应好和风格多样等特点,能天生高分辨率、高帧率的原生视频。这标志着海内又一家AI企业加入了视频天生模型的混战。
自今年2月OpenAI发布视比年夜模型Sora后,各大AI公司纷纭加码这一领域。短短几个月内,生数科技、快手、Luma AI、Runway、阿里达摩院、爱诗科技、智谱等有名企业先后推出了自己的视频天生产品。可以说,过去一年对付AI视频天生来说是一个历史性的时候。
大模型玩视频的必要性
对付MiniMax布局视频天生,创始人闫俊杰表示,这是一定选择。由于人类社会的信息更多表示在多模态内容上,生活中笔墨交互只占很小一部分,更多是语音和视频。因此,大模型厂商必须能输出多模态内容,而不但是笔墨,才能实现更高的用户覆盖度和利用深度。
"只是在之前我们先做出来笔墨,又做出来声音,很早做出来了图片,现在技能变得更强,(可以)把视频也做出来。这个路线是一以贯之的,一定要能做多模态。"闫俊杰说。
视频天生仍面临诸多寻衅
但视频天生技能并非易事,目前的天生结果远未达到用户期望。闫俊杰坦言,视频的事情繁芜度比做文本更难,由于视频的高下文文本天然很长,且数据量巨大,数据洗濯和标注都是难题。
此外,目前的视频天生模型还无法很好地处理物理规则,随意马虎涌现手穿模到人身体里等问题。业内人士指出,视频生造诣像图像天生在2022年前夕,还没有一个特殊出色的"开源Sora"发布,各家还在摸索探路。
不过,有研究机构预测,3年内视频天生将全面爆发,结合3D能力,可控的视频天生将对影视、动画、短片的生产模式带来变革。可以预见,视频天生模型将是未来AI发展的主要方向之一。
视频天生技能的未来前景广阔
只管目前视频天生模型还面临诸多技能难题,但专家书任这一领域将迎来长足发展。正如启明创投的研究指出,未来3年内视频天生有望全面爆发,结合3D能力,可控的视频天生将带来影视、动画等行业的革命性变革。
这一预测并非空穴来风。我们可以从两个方面来剖析视频天生的未来潜力:
第一,技能打破带来效率提升。随着自然措辞处理、打算机视觉等核心技能的不断进步,视频天生模型将逐步战胜当前存在的物理规则、细节把控等问题。专家预测,未来图像和视频隐空间表示的压缩率将提升5倍以上,从而使天生速率提升5倍。这将为视频内容的海量生产创造条件。
第二,运用处景日益广泛。视频已成为互联网时期主要的信息呈现形式,在娱乐、教诲、营销等领域扮演着不可替代的角色。随着视频天生技能的成熟,它将渗透到影视制作、电商直播、广告创意等更多领域,大幅提升内容生产效率,给干系家当带来新的发展空间。
因此,只管现阶段视频天生仍有不少技能瓶颈有待破解,但从长远来看,这一领域无疑是AI发展的重点方向之一。各大科技公司加速布局,瞄准这一"新蓝海",无疑捉住了行业发展的主要机遇。只要持续努力,相信不久的将来,高质量、可控的AI天生视频将遍及于大众视野。
[免责声明]文章的韶光、过程、图片均来自于网络,文章旨在传播正能量,均无低俗等不良勾引,请不雅观众勿对号入座,并上升到人身攻击等方面。不雅观众理性看待本事件,切勿留下主不雅观臆断的恶意评论,互联网不是法外之地。本文如若真实性存在争议、事宜版权或图片侵权问题,请及时联系作者,我们将予以删除。\r本文作者无意针对,影射任何现实国家,政体,组织,种族,个人。干系数据,理论考证于网络资料,以上内容并不代表本文作者赞许文章中的律法,规则,不雅观点,行为以及对干系资料的真实性卖力。本文作者就以上或干系所产生的任何问题概不卖力,亦不承担当何直接与间接的法律任务\r