谷歌旗下的 DeepMind 团队近日推出 Genie 的全新 AI模型,共有 110 亿个参数,能够基于用户输入的一张图片和提示词,生成一款较为完整的 2D 平台游戏。
Genie 通过了网络上超过 20 万小时的 2D 游戏视频训练,目前只是一个研究预览版,这些游戏更像是 2D 平台游戏,而不是完全的 VR 游戏。
该团队评论说:“Genie 有 11B 个参数,可以说是一个基础世界模型。它由一个时空视频标记器、一个自回归动力学模型和一个简单且可扩展的潜在行动模型组成”。
Genie 是在无监督和无标签视频的情况下进行训练的,因此能够学习各种角色的动作、控制和行动,并以一致的方式进行学习。
对于用户来说,基本上只要提供一张纸上的草图、一幅完美的数字艺术作品,甚至是人工智能生成对二维世界的描述,Genie 就会完成剩下的工作,帮你生成 2D 游戏。
它能生成图像和其他资产,将你的草图变成一个完全实现的开放世界,然后根据玩家提供的操作预测下一个像素帧。