OpenAI称GPT-5在广泛职业任务中已接近人类水平

2025年09月26日来源:techcrunch分类:人工智能
OpenAI称GPT-5在广泛职业任务中已接近人类水平 图片封面
1
OpenAI公布了新的评测基准GDPval,测试其AI模型在医疗、金融、制造和政府等九大行业44类职业中的表现。结果显示,GPT-5及其增强版在40.6%的任务中被评为与行业专家持平或更优,而Anthropic的Claude Opus 4.1得分更高,达到49%。尽管评测目前仅限于研究报告类任务,并不能涵盖真实工作中的全部复杂性,OpenAI仍认为这是迈向通用人工智能的重要进展。相比15个月前GPT-4o仅有13.7%的水平,GPT-5的跃升显示出明显加速趋势。OpenAI表示,这将帮助专业人士把重复性任务交给AI,从而专注于更有价值的工作。不过,该公司也承认需要更全面的评估体系,才能真正验证AI是否在整体上超越人类。
支持率<5%