谷歌发布AI基础世界模型Genie,一张图可生成一个交互式世界

谷歌发布了110亿参数的全新AI基础世界模型。仅用一张图片,便可生成一个交互式世界,生成的世界“动作可控”,用户可以其中逐帧行动。谷歌将该模型命名为Genie(生成式交互环境,Genie一词中文意为“精灵”)。谷歌表示,Genie开启了“图/文生成交互世界”的时代,还将成为实现通用AI Agent的催化剂。

搜索