OpenAI发布视屏天生工具Sora

60秒的一镜到底,视频中的女主角、背景人物,都达到了惊人的同等性,各种镜头随意切换,人物都是保持了神一样平常的稳定性。

OpenAI究竟是怎么做到的?根据官网先容,「通过一次性为模型供应多帧的预测,我们办理了一个具有寻衅性的问题」。
显然,这是一个王炸级技能有着革命般的意义,连Sam Altman都沉迷到不能自拔,海内的技能圈也已经炸锅了,这个天下果真如你所愿,技能才是第生平产力,从来不是房地产。

Sora根据提示天生的滑雪

太震撼OpenAI Sora居然60秒一镜到底直接从文本生成视频

借助于对措辞的深刻理解,Sora能够准确地理解用户指令中所表达的需求,把握这些元素在现实天下中的表现形式。
因此,Sora创造出的角色,能够表达丰富的情绪!
它所制作出的繁芜场景,不仅可以包括多个角色,还有特定的动作类型,以及对工具和背景的精确细节描述。

Sora根据提示天生的怪兽公司

举例:雪后的东京熙熙攘攘。
镜头穿过繁忙的街道,跟随着几位享受着俏丽雪景和在附近摊位购物的人们。
俏丽的樱花瓣伴随着雪花在风中飘舞。

Sora根据Prompt提示天生的东京景致

再举例:一个华美渲染的纸工艺品珊瑚礁海底天下,到处都是五颜六色的鱼和海洋生物

Sora根据Prompt提示天生的纸工艺品的海洋天下

不过,当前的模型并不完美。
它在仿照繁芜场景的物理效果上可能会碰着难题,有时也难以准确理解特定情境下的因果关系。
此外,模型在处理空间细节,如区分旁边时可能会出错,也可能在描述随韶光变革的事宜,如特定的摄影机动作轨迹时,表现不足精确。

好在,它还并不完美。
否则,虚拟和现实的界线,还能区分得清吗?但是无可否认的是,恐怖的事实已经就在面前:一个已经能够理解和仿照现实天下的模型,也就意味着AGI已经不远了。

原文链接:https://openai.com/sora

译文链接:https://mp.weixin.qq.com/s/93z4Ta91yLv7PB1pnBM9mg