OpenAI发布最新安全报告:披露ChatGPT滥用监控机制细节

2025年10月08日来源:gizmodo分类:人工智能
OpenAI发布最新安全报告:披露ChatGPT滥用监控机制细节 图片封面
1
OpenAI近日发布最新报告,公开其在ChatGPT滥用监控与威胁防控方面的运作机制。报告显示,自2024年2月以来,公司已识别并中断超过40个违反使用政策的网络活动,包括诈骗、网络攻击及国家关联的舆论操控行动。最新披露的案例涉及犯罪集团利用AI优化非法流程,以及政治影响项目,其中包括生成虚假视频脚本和社交媒体监控方案。OpenAI表示,其检测系统结合自动算法与人工审查,重点追踪“威胁行为模式”而非单次互动,以减少对正常用户的干扰。报告还提到,针对用户出现自残或暴力倾向的对话,AI会主动转向情绪安抚并引导求助,必要时人工团队可介入并通报警方。公司承认长时对话中模型安全表现可能下降,未来将继续优化防护机制,以平衡用户隐私与平台安全。
支持率>95%