欧洲在推进数字主权的进程中迈出新一步,正式启动OpenEuroLLM项目,旨在开发一系列“真正”开源的大语言模型(LLM),涵盖欧盟现有的24种官方语言以及部分候选国语言,如阿尔巴尼亚语。该项目由大约20家机构合作推进,其中包括布拉格查理大学的计算语言学家Jan Hajič和芬兰AI实验室Silo AI(去年被AMD以约4.9亿美元收购)。OpenEuroLLM获得了欧盟“数字欧洲计划”约1.6亿人民币(约合2000万欧元)资金支持,但相较于全球科技巨头的投入,这仍是杯水车薪。不过,该项目将利用欧盟超级计算中心EuroHPC的算力资源,总预算达到约550亿元人民币(约合70亿欧元)。尽管该项目仍处于早期阶段,部分行业人士对其多方协作模式是否能高效推进表示质疑,但项目负责人强调,团队已有多年技术积累,并计划在2026年推出首个版本,最终成果预计将在2028年完成。此外,该项目面临与EuroLLM的名称和目标重叠的问题,后者由另一批欧盟机构推进,已发布首批开源模型。尽管面临挑战,OpenEuroLLM的最终目标是确保欧洲拥有自主可控的AI基础设施,即使无法成为全球顶级模型,至少也要建立完全本土化的开源AI体系,为企业和研究机构提供可依赖的LLM模型,确保欧洲在AI领域的独立性。