...
...

OpenAI推出安全评估中心 提高AI幻觉率与有害内容透明度

大多数支持

OpenAI近日上线“安全评估中心”网页,首次公开其模型的幻觉率、有害内容生成情况、指令服从度以及越狱尝试等关键安全指标。该中心作为“系统卡”资料的补充,承诺将持续更新,为研究人员和公众提供更清晰的模型能力与风险概况。尽管目前评估与披露工作仍由OpenAI主导,缺乏外部监督机制,但官方表示希望通过该平台提升整个行业的透明度,并推动AI安全评估方法的标准化和可扩展性。当前页面已涵盖GPT-4.1至4.5的相关数据,未来还将逐步扩展。