OpenAI的o3模型在ARC-AGI基准测试中取得了85%的得分,超过了先前的AI最佳成绩55%,并与人类平均得分持平。此测试旨在衡量AI系统的“样本效率”,即AI系统在面对新情况时所需的示例数量。OpenAI的这一突破标志着通用人工智能(AGI)的目标取得了重要进展。尽管外界仍存怀疑,但许多AI研究者认为,AGI的实现正变得更加迫切和现实。
[较早]OpenAI的o3模型展示了AI扩展的新方式,但成本也随之上升
[较早]OpenAI发布o3模型,宣称接近AGI
[最近]泄露的文件显示 OpenAI 对“AGI”有非常明确的定义
[较早]OpenAI训练o1和o3模型以“思考”其安全政策