太震撼OpenAI Sora居然60秒一镜到底直接从文本生成视频

OpenAI发布视屏天生工具Sora

60秒的一镜到底，视频中的女主角、背景人物，都达到了惊人的同等性，各种镜头随意切换，人物都是保持了神一样平常的稳定性。

OpenAI究竟是怎么做到的？根据官网先容，「通过一次性为模型供应多帧的预测，我们办理了一个具有寻衅性的问题」。
显然，这是一个王炸级技能有着革命般的意义，连Sam Altman都沉迷到不能自拔，海内的技能圈也已经炸锅了，这个天下果真如你所愿，技能才是第生平产力，从来不是房地产。

Sora根据提示天生的滑雪

借助于对措辞的深刻理解，Sora能够准确地理解用户指令中所表达的需求，把握这些元素在现实天下中的表现形式。
因此，Sora创造出的角色，能够表达丰富的情绪！
它所制作出的繁芜场景，不仅可以包括多个角色，还有特定的动作类型，以及对工具和背景的精确细节描述。

Sora根据提示天生的怪兽公司

举例：雪后的东京熙熙攘攘。
镜头穿过繁忙的街道，跟随着几位享受着俏丽雪景和在附近摊位购物的人们。
俏丽的樱花瓣伴随着雪花在风中飘舞。

Sora根据Prompt提示天生的东京景致

再举例：一个华美渲染的纸工艺品珊瑚礁海底天下，到处都是五颜六色的鱼和海洋生物

Sora根据Prompt提示天生的纸工艺品的海洋天下

不过，当前的模型并不完美。
它在仿照繁芜场景的物理效果上可能会碰着难题，有时也难以准确理解特定情境下的因果关系。
此外，模型在处理空间细节，如区分旁边时可能会出错，也可能在描述随韶光变革的事宜，如特定的摄影机动作轨迹时，表现不足精确。

好在，它还并不完美。
否则，虚拟和现实的界线，还能区分得清吗？但是无可否认的是，恐怖的事实已经就在面前：一个已经能够理解和仿照现实天下的模型，也就意味着AGI已经不远了。

原文链接：https://openai.com/sora

译文链接：https://mp.weixin.qq.com/s/93z4Ta91yLv7PB1pnBM9mg

每期AI知识网