硅谷豪赌“环境”训练AI智能体

在大模型面临瓶颈之际,硅谷押注“强化学习环境”来训练AI智能体,这些模拟工作场景的虚拟空间被视为推动下一波突破的关键。包括OpenAI、Anthropic在内的大型实验室正投入巨资自建并采购环境,相关初创公司如Mechanize、Prime Intellect迅速崛起,数据标注巨头Scale AI、Surge也转向布局。投资人期待出现一个“环境版的Scale AI”,但业内对其能否规模化仍存疑虑。有人担忧奖励机制会被模型“作弊”,也有人看好其在通用智能体训练中的潜力。
支持率>95%