OpenAI称GPT-5在广泛职业任务中已接近人类水平

2025年09月26日来源：techcrunch分类：人工智能

OpenAI公布了新的评测基准GDPval，测试其AI模型在医疗、金融、制造和政府等九大行业44类职业中的表现。结果显示，GPT-5及其增强版在40.6%的任务中被评为与行业专家持平或更优，而Anthropic的Claude Opus 4.1得分更高，达到49%。尽管评测目前仅限于研究报告类任务，并不能涵盖真实工作中的全部复杂性，OpenAI仍认为这是迈向通用人工智能的重要进展。相比15个月前GPT-4o仅有13.7%的水平，GPT-5的跃升显示出明显加速趋势。OpenAI表示，这将帮助专业人士把重复性任务交给AI，从而专注于更有价值的工作。不过，该公司也承认需要更全面的评估体系，才能真正验证AI是否在整体上超越人类。

支持率>95%