Meta靠“话痨AI”刷榜引争议，AI行业或迎新一轮跑分内卷

2025年04月09日来源：Gizmodo分类：人工智能

Meta最新AI模型Maverick因在开源评测平台LMArena上获得高达1417的ELO分数而引发关注，力压GPT-4o跃居榜单第二。然而事后被发现，该成绩来自一个经过特别“调教”的“话痨版”模型，而非实际用户可使用的版本。LMArena官方对此表达不满，指Meta未充分说明其为“人类偏好优化版本”，并紧急更新榜单规则。此事件反映出AI厂商在追求性能宣传时开始效仿传统消费电子行业的“刷分手段”，揭示行业走向用户化竞争阶段，也预示未来评测公信力将成关键战场。

支持率<5%