
在人工智能浪潮席卷全球之际,瑞士不动声色地打出了一张重要的“国家牌”。近日,瑞士正式发布了其首个完全自主研发、且完全开源的大语言模型——Apertus。这项由瑞士联邦理工学院(EPFL)、苏黎世联邦理工学院(ETH Zurich)以及国家超级计算中心(CSCS)联合打造的重磅项目,不仅彰显了瑞士在AI领域的自主创新实力,更预示着全球AI格局可能迎来新的变数。
Apertus的出现,并非仅仅是又一个AI模型的诞生。它更像是瑞士对当前由少数国际巨头主导的AI生态的一次有力回应。与许多模型侧重英语不同,Apertus在设计之初就展现出了强大的多元文化视野。它能够处理超过1000种语言,而且有高达40%的训练数据来自于非英语语种。这样的设定,不仅让Apertus能够更好地理解和适应全球的语言多样性,尤其能贴合瑞士国内如瑞士德语、罗曼什语等小语种的特殊需求,为本土用户提供了更贴心的服务。
更值得关注的是,Apertus的开源策略极其彻底。研发团队不仅公开了模型的核心权重,还将模型的架构设计、训练数据集的构成乃至具体的训练流程都一并对外披露。配合其宽松的开源许可证,Apertus欢迎教育、科研机构乃至商业用户自由使用和二次开发。这意味着,无论是想深入研究AI原理的学生,还是希望将AI技术融入自身产品创新的开发者,都可以更低门槛地接触和利用Apertus,极大地促进了AI技术的普及和创新活力。
支撑起Apertus庞大身躯的是瑞士强大的计算能力。它在国家级的“Alps”超级计算机上完成训练,这套系统配备了超过1万颗NVIDIA Grace Hopper GPU,并且训练过程全部使用可再生能源,充分体现了瑞士对可持续发展的承诺。在模型规模上,Apertus提供了两种选择:一个80亿参数的版本,适合个人用户或对算力要求不高的应用场景;另一个700亿参数的版本,则专为处理更复杂的任务和大规模部署而设计。目前,用户可以通过Swisscom平台、Hugging Face以及Public AI Network等多个渠道获取Apertus。
瑞士政府将Apertus的发布视为将AI打造为国家公共基础设施的关键一步。他们强调,Apertus的开发和推广将始终围绕合规性、透明度和普惠价值展开,旨在赋能科研、教育和产业的创新能力。这不仅仅是发布一个模型,更是瑞士在AI时代构建开放、自主、可持续发展生态的一次战略布局,其影响值得我们持续关注。