MiniMax加入视频生成混战大年夜模型的尽头是做视频

视频天生模型成新赛道

8月31日, AI独角兽公司MiniMax正式推出视频天生模型"video-1"。
据悉,这款模型拥有压缩率高、文本相应好和风格多样等特点,能天生高分辨率、高帧率的原生视频。
这标志着海内又一家AI企业加入了视频天生模型的混战。

自今年2月OpenAI发布视比年夜模型Sora后,各大AI公司纷纭加码这一领域。
短短几个月内,生数科技、快手、Luma AI、Runway、阿里达摩院、爱诗科技、智谱等有名企业先后推出了自己的视频天生产品。
可以说,过去一年对付AI视频天生来说是一个历史性的时候。

大模型玩视频的必要性

MiniMax加入视频生成混战大年夜模型的尽头是做视频

对付MiniMax布局视频天生,创始人闫俊杰表示,这是一定选择。
由于人类社会的信息更多表示在多模态内容上,生活中笔墨交互只占很小一部分,更多是语音和视频。
因此,大模型厂商必须能输出多模态内容,而不但是笔墨,才能实现更高的用户覆盖度和利用深度。

"只是在之前我们先做出来笔墨,又做出来声音,很早做出来了图片,现在技能变得更强,（可以）把视频也做出来。
这个路线是一以贯之的,一定要能做多模态。
"闫俊杰说。

视频天生仍面临诸多寻衅

但视频天生技能并非易事,目前的天生结果远未达到用户期望。
闫俊杰坦言,视频的事情繁芜度比做文本更难,由于视频的高下文文本天然很长,且数据量巨大,数据洗濯和标注都是难题。

此外,目前的视频天生模型还无法很好地处理物理规则,随意马虎涌现手穿模到人身体里等问题。
业内人士指出,视频生造诣像图像天生在2022年前夕,还没有一个特殊出色的"开源Sora"发布,各家还在摸索探路。

不过,有研究机构预测,3年内视频天生将全面爆发,结合3D能力,可控的视频天生将对影视、动画、短片的生产模式带来变革。
可以预见,视频天生模型将是未来AI发展的主要方向之一。

视频天生技能的未来前景广阔

只管目前视频天生模型还面临诸多技能难题,但专家书任这一领域将迎来长足发展。
正如启明创投的研究指出,未来3年内视频天生有望全面爆发,结合3D能力,可控的视频天生将带来影视、动画等行业的革命性变革。

这一预测并非空穴来风。
我们可以从两个方面来剖析视频天生的未来潜力:

第一,技能打破带来效率提升。
随着自然措辞处理、打算机视觉等核心技能的不断进步,视频天生模型将逐步战胜当前存在的物理规则、细节把控等问题。
专家预测,未来图像和视频隐空间表示的压缩率将提升5倍以上,从而使天生速率提升5倍。
这将为视频内容的海量生产创造条件。

第二,运用处景日益广泛。
视频已成为互联网时期主要的信息呈现形式,在娱乐、教诲、营销等领域扮演着不可替代的角色。
随着视频天生技能的成熟,它将渗透到影视制作、电商直播、广告创意等更多领域,大幅提升内容生产效率,给干系家当带来新的发展空间。

因此,只管现阶段视频天生仍有不少技能瓶颈有待破解,但从长远来看,这一领域无疑是AI发展的重点方向之一。
各大科技公司加速布局,瞄准这一"新蓝海",无疑捉住了行业发展的主要机遇。
只要持续努力,相信不久的将来,高质量、可控的AI天生视频将遍及于大众视野。

[免责声明]文章的韶光、过程、图片均来自于网络，文章旨在传播正能量，均无低俗等不良勾引，请不雅观众勿对号入座，并上升到人身攻击等方面。
不雅观众理性看待本事件，切勿留下主不雅观臆断的恶意评论，互联网不是法外之地。
本文如若真实性存在争议、事宜版权或图片侵权问题，请及时联系作者，我们将予以删除。
\r本文作者无意针对，影射任何现实国家，政体，组织，种族，个人。
干系数据，理论考证于网络资料，以上内容并不代表本文作者赞许文章中的律法，规则，不雅观点，行为以及对干系资料的真实性卖力。
本文作者就以上或干系所产生的任何问题概不卖力，亦不承担当何直接与间接的法律任务\r

每期AI知识网

MiniMax加入视频生成混战大年夜模型的尽头是做视频

王牌对王牌AI换脸环节让人捧腹大年夜笑

教训淄博消防传递近期8起范例失火事件