DeepSeek推出新AI模型V3 成为最强“开放”竞争者之一
来源:techcrunch
DeepSeek推出的新AI模型DeepSeek V3被认为是目前最强的“开放”AI模型之一。该模型在多个基准测试中超过了包括Meta的Llama 3.1、OpenAI的GPT-4和阿里巴巴的Qwen 2.5等“封闭”模型。DeepSeek V3具有6710亿参数,并且训练数据达到14.8万亿tokens,显著提升了文本生成、编程、翻译等多项任务的能力。虽然其训练使用了受限的Nvidia GPU,并且只花费了550万美元,DeepSeek V3的性能仍然令人印象深刻。