Google DeepMind近日公布其最新世界模型Genie 3,被视为通往“通用人工智能(AGI)”的重要里程碑。Genie 3是首个可实时生成交互式3D环境的通用型世界模型,可从文本指令中生成持续几分钟、具有物理一致性的720p三维模拟世界。不同于以往依赖硬编码物理引擎的系统,Genie 3通过自我回顾生成历史来理解物理规律,并支持“可提示的世界事件”,能动态调整模拟场景。DeepMind认为,这种能够让AI在虚拟环境中自主探索和学习的模型,是训练“具身智能代理”的关键环节。尽管Genie 3仍受限于模拟时长和多代理复杂交互等问题,但它已展现出接近人类学习方式的潜力,有望推动AI迈入具创造性与自我驱动能力的新纪元。