近日,谷歌和以色列特拉维夫大学的研究职员联合推出了一款名为 GameNGen 的 AI 模型,这一最新技能进展能够实时交互式仿照 1993 年经典第一人称射击游戏《毁灭战士》(Doom)。

日前,干系论文以《扩散模型是实时游戏引擎》(Diffusion Models Are Real-Time Game Engines)为题在预印本网站 arXiv 上揭橥 [1],该模型已在 GitHub 上开源。

论文作者包括:丹尼·瓦列夫斯基(Dani Valevski)、亚尼夫·利维坦(Yaniv Leviathan)、摩阿布·阿拉尔(Moab Arar)和肖米·弗鲁赫特(Shomi Fruchter)。

图丨干系论文(来源:arXiv)

谷歌推出AI游戏开拓模型GameNGen让小我创作者也能制作复杂游戏

GameNGen 是一个由神经网络驱动的系统,其核心在于它能够在没有传统游戏引擎的情形下,通过 AI 技能实时天生游戏画面。

传统的游戏引擎每每基于手工编写的代码,进行游戏状态管理并渲染视觉效果,这一过程不仅耗时且本钱高昂。

而 GameNGen 通过 AI 天生扩散模型,完备摆脱了这种传统方法,自动仿照全体游戏环境。

该系统利用 AI 图像天生模型 Stable Diffusion,最初用于天生静态图像。
而 GameNGen 则进一步扩展了这一技能,将其运用于实时互动的游戏仿照中。

在 GameNGen 的用例中,Stable Diffusion 模型被修正为能够预测游戏画面中的下一个状态。

这种预测不是基于固定的规则或预设的游戏逻辑,而是通过 AI 对之前状态的剖析和推测来实现的。

也便是说,GameNGen 能够动态地天生每一帧的游戏画面,而并非基于预先定义的场景或动作序列。

GameNGen 利用的另一项关键技能是神经网络,尤其是与图像天生干系的神经网络。

首先,研究职员演习了一个强化学习代理,让它通过玩游戏来天生大量的游戏画面数据。

随后,这些数据被用于演习 Stable Diffusion 模型,使其能够在给定前一帧的情形下,预测并天生下一帧的游戏画面。

这个过程包括了两个紧张阶段:

第一阶段是强化学习代理的演习,目的是通过自动游戏天生大量的演习数据。

第二阶段是将这些数据输入到 Stable Diffusion 模型中,以便模型能够学习如何从一帧游戏画面天生下一帧。

这种结合了强化学习和扩散模型的技能,使得 GameNGen 不仅能够天生单帧的高质量图像,还能够担保这些图像在韶光维度上的连贯性。

在传统的游戏开拓中,游戏画面的天生是通过预先设定的规则和算法来实现的。
这种方法虽然可以产生高质量的图像,但也须要大量的打算资源和韶光。

而 GameNGen 则通过神经渲染的办法,利用神经网络实时天生游戏画面。

这种渲染办法与传统的图形渲染方法有很大的不同,它不依赖于固定的规则,而是通过 AI 对当前游戏状态的“想象”来天生图像。

GameNGen 的出身和后续进展很可能引发游戏行业的变革。

传统的游戏开拓每每须要大量的人力和韶光来编写代码、设计关卡和创建游戏天下。
而 AI 驱动的引擎,如 GameNGen,能够自动天生这些内容,显著减少了开拓韶光和本钱。

这一技能打破可能使游戏创作更加方便,小型事情室乃至个人创作者也可以制作出繁芜、互动性强的游戏。

更主要的是,AI 驱动的游戏引擎不仅能够天生静态的游戏场景,还能够根据玩家的实时操作动态调度游戏内容。

这意味着,未来的游戏可能不再是预先设计好的固定内容,而是能够根据玩家的行为实时演化。

未来,或许这种动态天生的游戏天下将冲破传统游戏设计的桎梏,为玩家带来更加沉浸式和个性化的游戏体验。

只管 GameNGen 目前紧张在游戏领域运用,但其潜力远不止于此。
实时仿照适用于许多行业,特殊是在虚拟现实(VR,Virtual Reality)、增强现实(AR,Augmented Reality)、自动驾驶汽车和智能城市等领域。

在 VR 和 AR 中,AI 驱动的引擎可以创建完备沉浸式的互动天下,并实时响运用户的输入。

只管 GameNGen 展现了 AI 在游戏仿照中的巨大潜力,但这一技能在当前阶段仍面临诸多寻衅和限定。

首先,GameNGen 目前仅限于仿照一款相对大略的古老游戏,比较于当代游戏,其图形繁芜度较低。

要将 GameNGen 的技能运用于更繁芜的游戏或其他类型的仿照环境,须要战胜大量技能难题。

其次,GameNGen 天生的游戏画面偶尔会涌现图像故障,特殊是在处理较繁芜的游戏环境的情形。

这是由于 Stable Diffusion 模型的局限性,以及 AI 在天生连续帧时随意马虎涌现的累积偏差所导致的。

随着韶光的推移,这些小缺点会逐渐积累,终极可能导致天生的虚拟天下变得不稳定或失落真。

此外,GameNGen 只能访问短短三秒钟的游戏历史,这意味着当玩家重新访问先前经历的游戏关卡时,系统只能通过概任性预测进行仿照,而无法基于真实的游戏状态进行准确再现。

这种局限性限定了 GameNGen 在更大规模和更繁芜的游戏环境中运用。

只管目前存在一些技能寻衅,GameNGen 仍旧为未来的游戏开拓和其他运用处景开辟了广阔的前景。

随着 AI 技能的不断进步和打算本钱的降落,未来有望实现更繁芜的游戏和仿照环境。

与此同时,随着韶光的推移,AI 驱动的游戏引擎或将不仅限于仿照大略的游戏场景,而是能够天生大规模、繁芜且互动性强的虚拟天下。

参考资料:

1.https://arxiv.org/abs/2408.14837

https://arstechnica.com/information-technology/2024/08/new-ai-model-can-hallucinate-a-game-of-1993s-doom-in-real-time/

https://gamengen.github.io/

运营/排版:何晨龙