英伟达推出Nemotron 3开源模型，主打更高效率与长链路任务

2026年01月02日来源：Nvidia分类：人工智能

英伟达公布Nemotron系列第三代大语言模型的推进计划，并释放其中体量较小的版本，定位覆盖写作、代码与多步骤任务处理等常见生成式AI场景；该系列强调“更高效率”，也就是在同等任务下需要的算力与成本更低，同时在处理更长的上下文、或需要多步推理的任务时表现更稳。按照披露节奏，除已发布的小型版本外，后续还会在2026年上半年推出更大体量版本，形成从轻量部署到更强能力的梯度。开源策略通常意味着开发者与企业可以更容易进行本地化部署、微调与安全评估，并把模型嵌入到客服、搜索增强、代码辅助、文档处理等内部系统；对硬件厂商而言，这也有助于带动自家GPU与软件栈的生态黏性，因为模型推理效率的改善会直接影响同一硬件条件下可服务的并发量与单位成本。与此同时，开源模型在落地时也常伴随许可条款、权重可用范围与责任边界等问题，需要使用方在合规与数据治理上同步完善。

支持率>95%