万亿参数模型不再是“闭门造车”：蚂蚁开源Ring-1T-preview，AI推理能力直逼GPT-5

智享AI

封面图

在通用人工智能（AGI）的浪潮中，模型参数规模一直是衡量其潜力的重要指标之一。如今，这一“算力竞赛”的关键成果正加速走向开放。近日，蚂蚁集团出人意料地开源了其自研的万亿参数推理大模型——Ring-1T-preview。这意味着，全球首个万亿参数级别的开源模型正式亮相，为AI研究者和开发者打开了新的可能性。
Ring-1T-preview虽然只是一个预览版本，但其在多项关键性能测试中的表现，足以让人眼前一亮。在自然语言推理能力方面，它在AIME25测试中斩获92.6分，这一成绩不仅甩开了当前所有已知的开源模型，甚至逼近了被誉为“下一代AI标杆”的GPT-5（94.6分）。这足以说明，在处理复杂的逻辑关系和推理任务上，Ring-1T-preview已经具备了相当强的实力。
更令人惊喜的是，Ring-1T-preview在代码生成领域的表现也同样亮眼。在CodeForces测试中，它以94.69分的高分，在代码生成能力上甚至超越了GPT-5，并在LiveCodeBench和ARC-AGI-v1等权威榜单上登顶开源模型行列。这无疑为开发者们提供了一个强大的新工具，有望显著提升软件开发的效率和质量。
蚂蚁百灵团队并未止步于此，他们还对Ring-1T-preview进行了更具挑战性的推理测试，例如模拟国际奥林匹克数学竞赛（IMO25）。测试结果显示，该模型不仅能一次性解答一道高难度题目（第三题），还能在其他几道题目中推导出部分正确答案。这进一步印证了Ring-1T-preview在应对复杂、多步骤推理问题上的潜力。
目前，Ring-1T-preview的出现，标志着AI大模型领域的一个重要里程碑。开源社区的加入，将极大地加速AI技术的迭代与创新。蚂蚁集团此举，不仅展示了其在AI领域的技术实力，更体现了推动行业整体进步的决心。我们有理由期待，随着Ring-1T-preview的后续训练和正式版的发布，以及更多类似模型的涌现，AI的边界将不断被拓展，其应用场景也将更加丰富多元。

liliaishuo

这下好了，又一个大模型出来了，玩不过来了！