12月5日,谷歌DeepMind放出了新一代世界模型Genie 2,可以“一张图生成1分钟游戏3D世界”,网友惊呼“黑客帝国来了”。
Genie 2是谷歌第二代世界模型,给定一张图像,就能生成一个通过键盘和鼠标输入的、可操作的3D环境。
图像中的角色,可以被键盘识别并响应智能操作。
同一个起始帧,可以生成不同的运动轨迹。
Genie 2前后记忆具有一致性,周围场景即便不可见时,也不会发生扭曲。
可贵的是,Genie 2可以根据画面实时生成新场景,最长可达一分钟。
交互功能上,Genie 2可以对交互关系进行建模,例如爆破气球、打开门和射击炸药桶等。