7月26日,智谱AI CEO张鹏在智谱Open Day上宣告,AI天生视频模型清影(Ying)正式上线智谱清言,新京报贝壳财经实测了清影的视频天生能力,并现场采访了张鹏。
实测:等待韶光在1分钟以内 视频可选择4种风格
张鹏“官宣”清影发布后,新京报贝壳财经登录智谱清言首页创造,涌现了一个“清影智能体-AI生视频上线啦!
”的弹窗,点击进入并申请内测体验后,申请险些被“秒通过”,随后进入了清影的界面。
创造,清影分文生视频与图生视频两种模式,个中文生视频可以通过输入不超过1000个笔墨的办法进行视频天生,进阶参数还包括视频风格、情绪氛围、运镜办法等,每一个参数又有不同的子选单,如视频风格包括3D卡通、黑白老照片、油画、电影感等。
输入完毕并点击天生后,清影显示“估量排队1分钟”,实际不到一分钟,就天生了描述的“草原上背对镜头的牛仔”的画面(智谱官方表示天生6秒视频只须要30秒的韶光)。此前,也以类似的提示词在可灵上天生了一段视频,下图为二者的比拟。
清影天生的视频截图。
可灵天生的视频截图。
可以看出,两个大模型都天生了描述的场景,不过风格有所不同。此外,比较清影不敷1分钟的等待韶光,目前可灵的排队韶光较长,今日向可灵提交了一个视频天生哀求后,被奉告须要等待近300分钟。
作为一个刚刚上线的AI生视比年夜模型,清影也有须要完善的地方,如输入“潘长江和姚明打篮球”的提示词,在等待了1分钟后被提示“视频天生失落败”。对此,张鹏十分坦诚地表示,自己也有天生失落败的经历,“目前是网络Bug的过程,欢迎大家反馈。”
据理解,清影能够天生1440x960清晰度的高精度视频。“清影底层的视频天生模型是CogVideoX,它能将文本、韶光、空间三个维度领悟起来,参考了Sora的算法设计,它也是一个DiT架构,通过优化,CogVideoX 比较前代(CogVideo)推理速率提升了6倍。我们将连续努力迭代,在后续版本中,陆续推出更高分辨率、更永劫长的天生视频功能。”张鹏说。
免费利用但需排队 付费5元“加速”一天
在实测中,贝壳财经把稳到,C端用户利用清影是免费的,只不过要想在排队中“加速”须要支付用度,用度为24小时5元,一年199元。此外,视频天生能力也接入了API,定价为价格为0.5元/次。
对付为何选择这一价格,张鹏见告贝壳财经,目前AI天生视频还处在低级考试测验阶段,以是采取了大家可用付费加速的模式。值得把稳的是,包括Sora在内,目前许多AI天生视频模型并未把能力开放给"大众。在张鹏看来,本钱可能是其不开放的缘故原由之一,“顶不住很多人来用”。
而对付清影的开放上线,张鹏表示,“这是为了让大家体验一下目前视频天生在每人可用的条件下能做到什么程度,而不是关在实验室里。现阶段,无论是to C还是to B,纯粹走向大规模商业化还比较早。”
在他看来,AI天生视频是未来实现AGI(通用人工智能)必须要走的路径,而从产品上来说,清影未来是否会独立商业化,“只要市场有需求,我们就会做。收费策略目前是早期考试测验,后会调度。”
目前技能仍存局限性 本钱够便宜AI生视频才会爆发
张鹏表示,视频天生非常依赖于数据,因此智谱AI通过互助伙伴,以及公开数据集的办法一起完成了数据积累。
另一方面,目前AI天生视频也依旧存在多种局限性,如人物脸庞不稳定等,每次天生都有随机性等问题。对此,张鹏在接管采访时表示,目前AI天生视频已经可以知足某些特定的需求,包括广告短片、演示视频、创意观点表达等,对付哀求韶光、效率非常快,且对细节哀求不严苛时,AI生视频产品能够帮助用户快速降落本钱和周期。
对付清影目前有哪些“短板”,张鹏表示,目前虽然模型的指令屈服能力非常强,但是当输入细节非常多时还会遗漏一些细节,屈服能力和可控性上须要连续提高。此外,在帧和帧之间,或者说全体动态展示之间有些细节还存在优化提升的空间,从这个角度来说,一是数据的缘故原由,二是算法上、方法上还有改进的地方。
在被问到如何看待天生式视频技能发展的前景时,张鹏回答贝壳财经称,“当天生式视频的本钱已经便宜到大家都无所谓了,这个事情就会大规模运用,过程中也会产生其他的商业化的办法,本钱收益之间也在持续动态变革。”
联系邮箱:luoyidan@xjbnews.com
新京报贝壳财经 罗亦丹 编辑 陈莉 校正 穆祥桐