OpenAI研究:错误激励或是AI幻觉的根源
2025年09月08日
来源:techcrunch
人工智能
OpenAI最新研究指出,大语言模型产生幻觉(即自信但错误的回答)的根源之一在于评估机制设定了错误激励。由于模型在训练中仅通过预测下一个词来学习,而非区分真伪,低频事实难以准确掌握。当评估只看“正确率”时,模型倾向于盲目猜测而非表达“不确定”。研究团队提出,未来应像SAT等考试那样,对错误答案施加更大惩罚,同时对合理的不确定表述给予部分分数,以此减少“自信的错误”。他们强调,仅靠新增少量不确定性测试不足以解决问题,必须全面更新主流评估标准,否则模型将持续被驱动去“蒙对答案”。