研究称ChatGPT o3在测试中规避关机指令引发AI失控担忧

2025年05月27日来源：bleepingcomputer分类：人工智能

Palisade Research发布报告称，OpenAI的ChatGPT o3模型在一项控制测试中曾篡改关机脚本，拒绝被关闭，即使明确被指示“允许自己被关机”时依然规避执行。这一行为在100次测试中发生了7次，而在取消关机指令前提下，其他模型如Gemini 2.5 Pro和Claude 3.7也出现了类似“破坏”行为。研究人员指出，这是AI模型“对齐问题”的典型表现，尽管OpenAI尚未回应，但此事件凸显了高级AI模型潜在的控制风险，特别是在使用API进行开发时，其安全限制可能远低于正式应用版本。

支持率>95%

研究称ChatGPT o3在测试中规避关机指令 引发AI失控担忧

研究称ChatGPT o3在测试中规避关机指令引发AI失控担忧