...
...

OpenAI 新模型通过“通用智能”测试,成绩接近人类水平

大多数支持

OpenAI的o3模型在ARC-AGI基准测试中取得了85%的得分,超过了先前的AI最佳成绩55%,并与人类平均得分持平。此测试旨在衡量AI系统的“样本效率”,即AI系统在面对新情况时所需的示例数量。OpenAI的这一突破标志着通用人工智能(AGI)的目标取得了重要进展。尽管外界仍存怀疑,但许多AI研究者认为,AGI的实现正变得更加迫切和现实。