“强化学习鸿沟”:为何某些AI技能进步飞快,而另一些停滞不前

2025年10月06日来源:techcrunch分类:人工智能
“强化学习鸿沟”:为何某些AI技能进步飞快,而另一些停滞不前 图片封面
1
工智能的发展正出现明显分化:代码生成类工具突飞猛进,而写作、邮件、客服等应用却提升有限。科技专栏作家Russell Brandom指出,这种差异源于所谓的“强化学习鸿沟”(Reinforcement Gap)——即AI是否能在海量、可自动判定对错的任务中反复自我训练。编程场景拥有天然的测试体系,如单元测试、集成测试、安全验证等,让模型能在数十亿次试错中迅速提升;而文字创作、客户沟通等主观性强的领域则难以建立标准化评价体系,导致进步缓慢。文章以OpenAI的Sora 2视频模型为例说明,视觉一致性、物理规律等特征可能已通过强化学习系统逐项优化,使生成画面从“幻觉”走向真实。Brandom认为,只要强化学习仍是AI商业化的核心手段,这一“可测试能力差距”将持续扩大——处于可量化一侧的行业(如编程、金融建模、甚至部分医疗流程)将率先被自动化,另一侧的职业则相对安全,但创新节奏放缓。这种鸿沟不仅决定AI产品的竞争力,也将深刻重塑未来二十年的劳动结构与经济版图。
支持率>95%