
今天,蚂蚁数科扔出一个重磅炸弹:正式发布Ling-2.6-flash的商业版本——LingDT-2.6-flash。这玩意儿最大的卖点是“Token效率”——同样的任务,它消耗的Token数量只有同类模型的十分之一。
Token是什么?简单说,就是大模型处理文字时按“个”收费的计量单位,好比出租车打表。Token越少,企业花在AI上的钱就越少。这个模型总参数量104B(相当于1040亿个参数),但真正干活时只激活7.4B参数,就像一台1000马力的发动机,平时只用70马力跑,省油又够劲。所以它在保持高智能水平的同时,推理速度和Token利用率都大幅提升。
蚂蚁数科还给它装上了一整套金融级别的安全防护:支持私有化部署、数据隔离、API权限管控。这意味着银行、保险这些对数据安全要求极严的企业也能放心用。目前模型已经在蚂蚁数科DT MaaS平台上线,限时8折,每百万tokens输入只要0.48元、输出1.44元——比一杯奶茶还便宜。
这背后是大模型竞争风向的转变。去年大家还在比谁家的模型跑分高、谁更像“大力出奇迹”,今年企业客户开始算账了:能不能落地?能不能省成本?蚂蚁数科这次选择了一条务实路线,从底层架构优化Token效率,彻底解决“模型很牛但用不起”的行业痛点。
其实这已经不是蚂蚁数科第一次瞄准企业场景。之前在金融领域,他们推出了金融推理大模型Agentar-Fin-R1和轻量级MoE模型LingDT-Fin-Mini 2.5,主打“行业大脑”+“执行手脚”的协同模式。目前蚂蚁数科已经打造了超百个金融场景智能体,覆盖AI手机银行、保险理赔、安全封控、财富管理等核心应用。
从技术演示到业务一线,从“炫技”到“降本”,大模型的路正在越走越实。当Token成本降到白菜价,AI才能真正像水电一样,成为企业基础设施。