Meta靠“话痨AI”刷榜引争议,AI行业或迎新一轮跑分内卷
2025年04月09日
来源:Gizmodo
人工智能
Meta最新AI模型Maverick因在开源评测平台LMArena上获得高达1417的ELO分数而引发关注,力压GPT-4o跃居榜单第二。然而事后被发现,该成绩来自一个经过特别“调教”的“话痨版”模型,而非实际用户可使用的版本。LMArena官方对此表达不满,指Meta未充分说明其为“人类偏好优化版本”,并紧急更新榜单规则。此事件反映出AI厂商在追求性能宣传时开始效仿传统消费电子行业的“刷分手段”,揭示行业走向用户化竞争阶段,也预示未来评测公信力将成关键战场。