
在刚刚结束的世界人工智能大会上,科技界迎来了一个振奋人心的消息:蚂蚁数科联合多家重量级机构,发布了专为金融领域量身打造的大模型评测基准——Finova。更引人注目的是,基于此基准,蚂蚁数科推出了其金融推理大模型Agentar-Fin-R1。这款模型不仅在多项关键评测中展现出超越同类产品的实力,更预示着金融行业在人工智能应用上的一个新起点。
Agentar-Fin-R1:不止是“懂金融”,更是“精通金融”
当前,金融行业正经历着前所未有的数字化转型浪潮,大模型作为驱动这一变革的核心技术,其在金融场景中的应用潜力被寄予厚望。然而,金融业务的特殊性——高度专业的知识、错综复杂的逻辑推理以及严苛的安全合规要求,使得通用大模型在实际落地时面临诸多挑战,存在着所谓的“知识鸿沟”。蚂蚁数科CEO赵闻飙的一番话点出了关键:“通用大模型距离产业实际应用存在‘知识鸿沟’。构建专业的金融大模型是推进金融与AI深度融合的必然路径,未来,金融大模型的应用深度将成为金融机构竞争力的关键要素。”
正是在这样的背景下,Agentar-Fin-R1应运而生。这款模型基于Qwen3研发,但其核心竞争力在于蚂蚁数科通过两大创新实现的“金融级”能力:
- 金融任务数据体系的精细构建: 蚂蚁数科打造了一个业内罕见的、覆盖金融全场景的专业数据体系,将金融任务细分为6大类、66小类,涵盖银行、证券、保险、基金、信托等各个细分领域。在此基础上,结合千亿级金融专业数据语料,运用可信数据合成技术,并融入专家标注的金融长思维链(CoT)构造机制,Agentar-Fin-R1仿佛被“注入”了金融的灵魂,能够更深刻地理解和处理复杂的金融任务,真正做到“天生懂金融,出厂即专家”。
- 模型训练算法的创新迭代: 通过创新的加权训练算法,Agentar-Fin-R1显著提升了其学习复杂金融任务的效率和性能。这意味着在实际应用中,企业能够大幅减少二次微调所需的数据和算力,有效降低大模型落地的门槛和成本。更重要的是,Agentar-Fin-R1具备持续更新迭代的能力,能够吸收最新的金融政策和市场动态,并通过配套评测工具进行针对性优化,使其在真实业务场景中保持“常学常新”。
在FinEval1.0、FinanceIQ等权威金融大模型评测基准上,Agentar-Fin-R1的表现堪称亮眼,不仅在金融专业性、推理能力和安全合规性上全面超越了同尺寸的通用开源大模型以及其他金融大模型,甚至在保持金融能力显著增强的同时,其通用能力也达到了较高水准。
Finova评测基准:为金融大模型应用“立规矩”
为了更客观、全面地衡量大模型在实际金融场景中的部署能力,蚂蚁数科更是联合了中国工商银行、宁波银行、北京前沿金融监管科技研究院、上海人工智能行业协会等机构,共同推出了Finova大模型金融应用评测基准。这一基准的推出,旨在深度考察大模型在智能体能力、复杂推理以及安全合规等关键维度的表现。Agentar-Fin-R1在Finova评测中同样摘得桂冠,其表现甚至超越了部分更大参数规模的通用模型。Finova的全面开源,也为整个行业的金融大模型应用水平提升奠定了坚实基础,有望推动形成良性的技术生态。
多维度模型矩阵,满足多样化部署需求
除了性能卓越的Agentar-Fin-R1,蚂蚁数科还提供了多款不同参数版本和架构的模型,以满足金融机构多样化的部署需求。Agentar-Fin-R1本身就提供了32B和8B两个参数版本,此外,还基于百灵大模型推出了MOE(Mixture-of-Experts)架构模型,以实现更优的推理速度。同时,还提供了非推理版本的14B和72B参数大模型,为不同场景下的应用提供了更灵活的选择。
AI赋能金融,已成效初显
蚂蚁数科作为蚂蚁集团旗下专注于AI及Web3技术赋能产业数智化升级的独立科技子公司,在金融领域的布局早已深入。此前推出的金融智能体平台Agentar,已成为首批通过信通院评测的智能体平台产品,并获得了最高评级。目前,蚂蚁数科已与超过100家金融机构达成合作,包括全部国有银行和股份制银行,以及超过60%的地方性商业银行。
以其助力上海某银行打造的AI手机银行为例,通过创新的“对话即服务”模式,用户能够通过自然语言交互获取各类金融服务,不仅显著提升了老年客户的使用体验和满意度,还带来了月活用户25%的同比增长。这些实践案例充分证明了,专业金融大模型正在切实解决实际业务痛点,驱动金融服务的智能化升级,并为金融机构带来可观的商业价值。
展望:金融大模型的未来,在“深度”与“广度”
Agentar-Fin-R1的发布以及Finova评测基准的推出,标志着金融大模型在专业性、可靠性和可控性上迈出了重要一步。未来,金融大模型的竞争将不再是参数的堆砌,而是体现在其对金融业务的理解深度、推理的精准度以及安全合规的严谨性上。随着技术的不断成熟和应用场景的持续拓展,我们有理由相信,金融大模型将成为驱动金融行业高质量发展的强大引擎,深刻地改变金融服务的形态和效率。