一项由METR研究机构开展的随机对照实验显示,使用当前AI编程工具(如Claude和Cursor Pro)不仅未能提升开发效率,反而使经验丰富的开源开发者完成任务时间平均增加了19%。尽管开发者主观认为AI让他们快了20%,但实测数据却显示相反,主要原因在于他们花费大量时间在提示撰写、等待生成以及审查修改AI代码上。研究还指出,AI生成的代码仅有不到44%被直接采纳,其余大多需人工调整。该研究强调AI工具在面对复杂、历史悠久的代码库时难以理解项目上下文与隐性规则,暴露出AI在高质量要求环境下的实用性限制。不过,研究人员仍对AI工具未来在性能和上下文理解能力上的改进持乐观态度。