比同行省90%Token，蚂蚁数科新模型要让企业用AI像用电一样便宜

智享AI

封面图

今天，蚂蚁数科扔出一个重磅炸弹：正式发布Ling-2.6-flash的商业版本——LingDT-2.6-flash。这玩意儿最大的卖点是“Token效率”——同样的任务，它消耗的Token数量只有同类模型的十分之一。
Token是什么？简单说，就是大模型处理文字时按“个”收费的计量单位，好比出租车打表。Token越少，企业花在AI上的钱就越少。这个模型总参数量104B（相当于1040亿个参数），但真正干活时只激活7.4B参数，就像一台1000马力的发动机，平时只用70马力跑，省油又够劲。所以它在保持高智能水平的同时，推理速度和Token利用率都大幅提升。
蚂蚁数科还给它装上了一整套金融级别的安全防护：支持私有化部署、数据隔离、API权限管控。这意味着银行、保险这些对数据安全要求极严的企业也能放心用。目前模型已经在蚂蚁数科DT MaaS平台上线，限时8折，每百万tokens输入只要0.48元、输出1.44元——比一杯奶茶还便宜。
这背后是大模型竞争风向的转变。去年大家还在比谁家的模型跑分高、谁更像“大力出奇迹”，今年企业客户开始算账了：能不能落地？能不能省成本？蚂蚁数科这次选择了一条务实路线，从底层架构优化Token效率，彻底解决“模型很牛但用不起”的行业痛点。
其实这已经不是蚂蚁数科第一次瞄准企业场景。之前在金融领域，他们推出了金融推理大模型Agentar-Fin-R1和轻量级MoE模型LingDT-Fin-Mini 2.5，主打“行业大脑”+“执行手脚”的协同模式。目前蚂蚁数科已经打造了超百个金融场景智能体，覆盖AI手机银行、保险理赔、安全封控、财富管理等核心应用。
从技术演示到业务一线，从“炫技”到“降本”，大模型的路正在越走越实。当Token成本降到白菜价，AI才能真正像水电一样，成为企业基础设施。