
欧洲AI公司Mistral AI近日再次出手,推出了一款名为Devstral 2的全新开源编码模型家族,并配套了名为Mistral Vibe CLI的命令行工具。这套组合拳的出现,无疑为开发者群体带来了惊喜。Devstral 2号称能大幅提升编程效率,尤其是在自动化编程和代码理解方面。更令人瞩目的是,它在一项衡量真实世界代码修复能力的基准测试中,取得了接近顶级闭源模型的成绩,而且目前API免费开放,这对于广大开发者来说,无疑是一个重大利好。
双尺寸模型,满足不同场景需求
Devstral 2系列并非单一模型,而是提供了两种不同规模的版本,以适应多样化的应用场景。
- Devstral 2 (123B): 这是家族中的旗舰型号,拥有1230亿参数。它被设计为企业级的“主力军”,特别擅长调用各种工具、处理多文件编辑以及深入探索复杂的代码库。在SWE-bench Verified这一权威测试中,它取得了72.2分的高分,在目前的开源模型中表现最为突出。
- Devstral Small 2 (24B): 顾名思义,这是一个更轻量级的版本,拥有240亿参数。它的优势在于可以在消费级硬件上本地运行,并且支持图像输入。这使得它非常适合那些对数据隐私有严格要求,或者需要在离线环境下工作的用户。
这两款模型都采用了先进的Transformer架构,并支持长达256K token的上下文窗口,这意味着它们能够理解和处理更长的代码序列,从而在复杂任务中表现更佳。值得一提的是,Devstral 2采用了修改版的MIT许可协议,而Devstral Small 2则采用了更为宽松的Apache 2.0协议,两者均已开源,并且Devstral 2的API目前是免费提供的,这极大地降低了开发者尝试和使用的门槛。
SWE-bench实测:开源编码Agent新标杆
Devstral 2在SWE-bench Verified基准测试中的表现尤为抢眼。SWE-bench Verified是一个衡量AI模型在真实GitHub问题解决能力的测试集。Devstral 2在此取得了72.2%的得分,这意味着它能成功修复72.2%的真实代码问题。这一成绩不仅远超了市面上大多数同类开源模型,甚至逼近了那些由巨头公司推出的、参数量更大的闭源模型。
更具吸引力的是其出色的成本效益。相较于参数规模更大的闭源模型,Devstral 2在实现同等性能时,成本效率可能高出7倍以上。这对于需要大规模自动化编码任务的场景,比如代码重构、Bug修复、多文件协同修改等,无疑具有巨大的吸引力。
Mistral Vibe CLI:对话式编程新体验
与Devstral 2模型一同发布的,还有Mistral Vibe CLI,一个由Devstral驱动的开源命令行工具。它将AI编码助手直接带入了终端,让开发者可以通过自然语言与代码库进行交互。
这个工具的核心亮点在于其强大的代码理解能力。它能够扫描整个项目的文件结构和Git状态,提供精确的上下文信息。开发者可以通过简单的指令,比如使用@来引用文件,使用!来执行shell命令,或者通过斜杠指令进行自定义配置。它能够理解整个代码库的逻辑,而不仅仅是当前正在编辑的文件。
Mistral Vibe CLI还提供了持久化的对话历史、智能的自动补全以及可自定义的主题,极大地提升了交互的便捷性和用户体验。这意味着开发者可以像与一位经验丰富的同事交流一样,通过对话来完成代码的探索、修改和执行等一系列操作,真正实现了“端到端自动化编程”。
开放策略驱动AI编程普及
Mistral AI此次的发布,不仅在技术上取得了突破,更在策略上强调了开放与实用。Devstral 2系列模型已经与多家开源Agent平台进行了深度整合,使得开发者能够快速地将其接入到现有的工作流中。
Devstral 2系列模型既能满足企业级生产环境的需求,也为个人开发者提供了本地部署的选项,这有助于推动AI编码工具的普惠化。分析人士认为,Mistral AI凭借Devstral 2的高性价比和Mistral Vibe CLI的创新交互方式,有望加速“Vibe Coding”(对话式编程)潮流的兴起,并对现有闭源AI模型的市场格局带来新的挑战。开发者们现在就可以通过官方API或Hugging Face平台体验这些新工具。