...
...

斯坦福团队用不到50美元训练AI推理模型 挑战OpenAI

斯坦福大学和华盛顿大学的研究团队宣布,他们仅用350元(约50美元)的云计算成本训练出了一款AI推理模型S1,这一突破引发了关于AI技术成本和开源趋势的讨论。S1的推理能力类似于OpenAI的o1,能够通过拆解问题来构建答案,例如在计算将所有Uber车辆替换为Waymo车辆的成本时,它会先查询现有Uber数量,再计算Waymo的生产成本。S1的训练方式是基于谷歌Gemini 2.0 Flashing Thinking Experimental的输出数据,仅利用1000个精心设计的问题和答案,让模型学会模拟Gemini的思考逻辑。研究人员还发现,只需在推理过程中添加“等待”指令,就能提高S1的答案准确度,这表明现有AI技术仍有大量优化空间。S1的成功再次表明,AI语言模型正在加速走向开源和低成本化,但这一趋势也引发了数据使用和版权争议。例如,OpenAI曾批评中国团队DeepSeek使用其模型输出进行训练,而S1的训练方式同样借鉴了谷歌Gemini的结果,尽管谷歌禁止这种做法,但业内普遍认为,利用大模型的“借力训练”方式将难以遏制。尽管S1的表现令人印象深刻,但它并非完全独立训练,而是依赖于现有大模型的成果,类似于图像压缩中的JPEG格式,虽然保留了关键信息,但仍有损失。同时,大型语言模型仍面临准确性问题,甚至谷歌的高管也曾未经事实核查就直接使用AI生成的内容。业界讨论的焦点是,随着类似S1的低成本模型出现,OpenAI和谷歌等企业的商业模式是否会受到冲击?支持者认为,AI大模型的商品化是不可避免的,未来企业的竞争力将更多取决于模型之上的应用层,如OpenAI的ChatGPT、Operator网络导航功能,或是xAI对X(前推特)数据的独家访问权。此外,AI的推理计算仍然成本高昂,随着AI被广泛应用,算力需求将持续增加,OpenAI计划斥资3.5万亿元(约5000亿美元)建设的服务器集群仍可能获得回报,前提是当前的AI浪潮不是一场泡沫。