最近有消息称,GTA 6 的发售时间再次推迟到了明年。
作为开放世界游戏的标杆,GTA 系列不仅在游戏圈内享有盛誉,还在多个技术领域发挥着重要作用。特别是 AI 驱动的视频生成、三维生成和世界模型等领域,研究者们不仅采用 GTA 游戏内的场景作为训练数据,还将生成类 GTA 的完整世界作为长期目标。
然而,GTA 6 的开发进度一直让人堪忧,甚至成为了大家调侃的对象。有人戏言,用 AI 制作一个 GTA 游戏比 GTA 6 的正式发布来得更快。例如,我们之前报道过的 Decart AI,就是一个很好的例子。


要真正用 AI 创建一个 GTA 游戏,游戏引擎是不可或缺的。一个多月前,我们报道了全球首个由实时世界模型驱动的 AI 原生 UGC 游戏引擎 Mirage。当时,我们使用公司附近的照片测试了其场景生成的效果,表现尚不尽如人意。
令人惊讶的是,仅仅过了一个多月,Mirage 就再次迭代,发布了更强大、更灵活且更智能的Mirage 2。Dynamic Labs 称其为生成式世界引擎,不仅仅是为游戏而生,而是为任何你能想象的互动世界。

Dynamic Labs 表示,从 Mirage 1 到 Mirage 2,仅仅一个多月,他们没有停止进步,而是加速前行。
01
他们声称,如果Mirage 1展示了类似 GTA 世界模型的潜力,那么Mirage 2则是一款通用领域的世界模型,可以让你即时创造、体验和改变任何游戏世界。
与 Mirage 1 一样,Mirage 2 支持上传图片并将其转换为可交互的游戏世界。此外,它还支持实时对话,在游戏过程中通过文本指令修改游戏世界。Mirage 2 生成的游戏场景可以通过视频进行分享。
Mirage 2 在生成性能上有了显著进步。主要改进包括:
- 更灵敏的提示控制:你的想法更快实现,画面更精准。
- 更低的游戏延迟:操作更顺畅,等待更少,沉浸感更强。
- 通用领域建模:不限题材,任何风格的世界都能实现。
上次,Mirage 仅发布了两款可玩的 demo,一个是 GTA 城市风格,另一个是竞速风格。这次打开 demo 页面,与 Mirage 1 的交互基本一致,但 UI 设计更加精致。特别是,Mirage 2 显著突出了各种不同风格的场景可选。

以下是一些与传统城市风格截然不同的例子:

吉卜力风格:村庄任务

儿童画:彩色城市

繁星之夜
通过这些不同风格的场景支持,Mirage 2 似乎已经有底气与 DeepMind 最新的 Genie 3 世界模型相抗衡。与 Genie 3 相比,Mirage 2 能够实现跑、跳、攻击等动作,超过十分钟的交互时间,200 毫秒的延迟水平,并能在单个消费级 GPU 上运行。但 Mirage 2 最大的优势在于:它已经上线,可以立即体验。
感兴趣的读者可以体验一下:https://demo.dynamicslab.ai/chaos

这次我们测试了更详细的 Prompt,效果比上次有显著提升。不仅显著改善了 Mirage 1 中物体比例的问题,加强了场景理解,场景的精度也有了明显提升。人和车的模型变得更加合理,车流已经初步具备了 GTA 4 的既视感。
尽管在线体验时的延迟仍然较高,人物灵敏度和上次相比感知不到明显改善,但导出的视频较为流畅。在 Mirage 1 发布时,团队成员 Zhiting Hu 表示推理时间约为 700 毫秒,而在 Mirage 2 上显著改善至 200 毫秒,并且 Dynamics Lab 表示仍有进一步加速的空间。

02
尽管 Mirage 2 在生成式世界建模方面取得了重大进展,但仍存在一些技术问题:
- 动作控制精度:角色的操作还不够完美,例如在右转等动作上,偶尔会出现响应偏慢的情况。
- 视觉一致性:在快速切换场景时,可能会出现细节上的意外变化。不过,通过合理的提示工程(prompt engineering),可以在较长时间内保持画面一致性。
我们在试玩过程中发现,visual consistency(视觉一致性)问题是感知最明显的地方。例如,当操作的主角走过一辆电瓶车时,视角被遮挡后,主角莫名其妙地变成了骑电瓶车的人;视角回转时,照片中的建筑物已经完全不是原先的样子。
这种效果与 Genie 3 的演示一致性的差距明显。正如读者在 Mirage 1 报道下的评论所言:

尽管仍有许多亟待解决的问题,但仅仅一个半月的时间,Mirage 就已经取得了如此显著的进步。九个月后的 GTA 6 发售时,这些 AI 驱动的 UGC 游戏引擎又会发展到哪一步呢?
