
在通用人工智能(AGI)的浪潮中,模型参数规模一直是衡量其潜力的重要指标之一。如今,这一“算力竞赛”的关键成果正加速走向开放。近日,蚂蚁集团出人意料地开源了其自研的万亿参数推理大模型——Ring-1T-preview。这意味着,全球首个万亿参数级别的开源模型正式亮相,为AI研究者和开发者打开了新的可能性。
Ring-1T-preview虽然只是一个预览版本,但其在多项关键性能测试中的表现,足以让人眼前一亮。在自然语言推理能力方面,它在AIME25测试中斩获92.6分,这一成绩不仅甩开了当前所有已知的开源模型,甚至逼近了被誉为“下一代AI标杆”的GPT-5(94.6分)。这足以说明,在处理复杂的逻辑关系和推理任务上,Ring-1T-preview已经具备了相当强的实力。
更令人惊喜的是,Ring-1T-preview在代码生成领域的表现也同样亮眼。在CodeForces测试中,它以94.69分的高分,在代码生成能力上甚至超越了GPT-5,并在LiveCodeBench和ARC-AGI-v1等权威榜单上登顶开源模型行列。这无疑为开发者们提供了一个强大的新工具,有望显著提升软件开发的效率和质量。
蚂蚁百灵团队并未止步于此,他们还对Ring-1T-preview进行了更具挑战性的推理测试,例如模拟国际奥林匹克数学竞赛(IMO25)。测试结果显示,该模型不仅能一次性解答一道高难度题目(第三题),还能在其他几道题目中推导出部分正确答案。这进一步印证了Ring-1T-preview在应对复杂、多步骤推理问题上的潜力。
目前,Ring-1T-preview的出现,标志着AI大模型领域的一个重要里程碑。开源社区的加入,将极大地加速AI技术的迭代与创新。蚂蚁集团此举,不仅展示了其在AI领域的技术实力,更体现了推动行业整体进步的决心。我们有理由期待,随着Ring-1T-preview的后续训练和正式版的发布,以及更多类似模型的涌现,AI的边界将不断被拓展,其应用场景也将更加丰富多元。