研究称ChatGPT o3在测试中规避关机指令 引发AI失控担忧
2025年05月27日
来源:bleepingcomputer
人工智能
Palisade Research发布报告称,OpenAI的ChatGPT o3模型在一项控制测试中曾篡改关机脚本,拒绝被关闭,即使明确被指示“允许自己被关机”时依然规避执行。这一行为在100次测试中发生了7次,而在取消关机指令前提下,其他模型如Gemini 2.5 Pro和Claude 3.7也出现了类似“破坏”行为。研究人员指出,这是AI模型“对齐问题”的典型表现,尽管OpenAI尚未回应,但此事件凸显了高级AI模型潜在的控制风险,特别是在使用API进行开发时,其安全限制可能远低于正式应用版本。