OpenAI发布最新安全报告：披露ChatGPT滥用监控机制细节

2025年10月08日来源：gizmodo分类：人工智能

OpenAI近日发布最新报告，公开其在ChatGPT滥用监控与威胁防控方面的运作机制。报告显示，自2024年2月以来，公司已识别并中断超过40个违反使用政策的网络活动，包括诈骗、网络攻击及国家关联的舆论操控行动。最新披露的案例涉及犯罪集团利用AI优化非法流程，以及政治影响项目，其中包括生成虚假视频脚本和社交媒体监控方案。OpenAI表示，其检测系统结合自动算法与人工审查，重点追踪“威胁行为模式”而非单次互动，以减少对正常用户的干扰。报告还提到，针对用户出现自残或暴力倾向的对话，AI会主动转向情绪安抚并引导求助，必要时人工团队可介入并通报警方。公司承认长时对话中模型安全表现可能下降，未来将继续优化防护机制，以平衡用户隐私与平台安全。

支持率>95%