OpenAI推出安全评估中心提高AI幻觉率与有害内容透明度

2025年05月15日来源：engadget分类：人工智能

OpenAI近日上线“安全评估中心”网页，首次公开其模型的幻觉率、有害内容生成情况、指令服从度以及越狱尝试等关键安全指标。该中心作为“系统卡”资料的补充，承诺将持续更新，为研究人员和公众提供更清晰的模型能力与风险概况。尽管目前评估与披露工作仍由OpenAI主导，缺乏外部监督机制，但官方表示希望通过该平台提升整个行业的透明度，并推动AI安全评估方法的标准化和可扩展性。当前页面已涵盖GPT-4.1至4.5的相关数据，未来还将逐步扩展。

支持率>95%

OpenAI推出安全评估中心 提高AI幻觉率与有害内容透明度

OpenAI推出安全评估中心提高AI幻觉率与有害内容透明度