欧洲AI公司Mistral AI近日再次出手，推出了一款名为Devstral 2的全新开源编码模型家族，并配套了名为Mistral Vibe CLI的命令行工具。这套组合拳的出现，无疑为开发者群体带来了惊喜。Devstral 2号称能大幅提升编程效率，尤其是在自动化编程和代码理解方面。更令人瞩目的是，它在一项衡量真实世界代码修复能力的基准测试中，取得了接近顶级闭源模型的成绩，而且目前API免费开放，这对于广大开发者来说，无疑是一个重大利好。双尺寸模型，满足不同场景需求 Devstral 2系列并非单一模型，而是提供了两种不同规模的版本，以适应多样化的应用场景。 Devstral 2 (123B): 这是家族中的旗舰型号，拥有1230亿参数。它被设计为企业级的“主力军”，特别擅长调用各种工具、处理多文件编辑以及深入探索复杂的代码库。在SWE-bench Verified这一权威测试中，它取得了72.2分的高分，在目前的开源模型中表现最为突出。 Devstral Small 2 (24B): 顾名思义，这是一个更轻量级的版本，拥有240亿参数。它的优势在于可以在消费级硬件上本地运行，并且支持图像输入。这使得它非常适合那些对数据隐私有严格要求，或者需要在离线环境下工作的用户。这两款模型都采用了先进的Transformer架构，并支持长达256K token的上下文窗口，这意味着它们能够理解和处理更长的代码序列，从而在复杂任务中表现更佳。值得一提的是，Devstral 2采用了修改版的MIT许可协议，而Devstral Small 2则采用了更为宽松的Apache 2.0协议，两者均已开源，并且Devstral 2的API目前是免费提供的，这极大地降低了开发者尝试和使用的门槛。 SWE-bench实测：开源编码Agent新标杆 Devstral 2在SWE-bench Verified基准测试中的表现尤为抢眼。SWE-bench Verified是一个衡量AI模型在真实GitHub问题解决能力的测试集。Devstral 2在此取得了72.2%的得分，这意味着它能成功修复72.2%的真实代码问题。这一成绩不仅远超了市面上大多数同类开源模型，甚至逼近了那些由巨头公司推出的、参数量更大的闭源模型。更具吸引力的是其出色的成本效益。相较于参数规模更大的闭源模型，Devstral 2在实现同等性能时，成本效率可能高出7倍以上。这对于需要大规模自动化编码任务的场景，比如代码重构、Bug修复、多文件协同修改等，无疑具有巨大的吸引力。 Mistral Vibe CLI：对话式编程新体验与Devstral 2模型一同发布的，还有Mistral Vibe CLI，一个由Devstral驱动的开源命令行工具。它将AI编码助手直接带入了终端，让开发者可以通过自然语言与代码库进行交互。这个工具的核心亮点在于其强大的代码理解能力。它能够扫描整个项目的文件结构和Git状态，提供精确的上下文信息。开发者可以通过简单的指令，比如使用 @ 来引用文件，使用 ! 来执行shell命令，或者通过斜杠指令进行自定义配置。它能够理解整个代码库的逻辑，而不仅仅是当前正在编辑的文件。 Mistral Vibe CLI还提供了持久化的对话历史、智能的自动补全以及可自定义的主题，极大地提升了交互的便捷性和用户体验。这意味着开发者可以像与一位经验丰富的同事交流一样，通过对话来完成代码的探索、修改和执行等一系列操作，真正实现了“端到端自动化编程”。开放策略驱动AI编程普及 Mistral AI此次的发布，不仅在技术上取得了突破，更在策略上强调了开放与实用。Devstral 2系列模型已经与多家开源Agent平台进行了深度整合，使得开发者能够快速地将其接入到现有的工作流中。 Devstral 2系列模型既能满足企业级生产环境的需求，也为个人开发者提供了本地部署的选项，这有助于推动AI编码工具的普惠化。分析人士认为，Mistral AI凭借Devstral 2的高性价比和Mistral Vibe CLI的创新交互方式，有望加速“Vibe Coding”（对话式编程）潮流的兴起，并对现有闭源AI模型的市场格局带来新的挑战。开发者们现在就可以通过官方API或Hugging Face平台体验这些新工具。

不写代码也能开发？Mistral AI开源“全能助手”，代码改写、Bug修复“聊几句”就搞定

智享AI

封面图

欧洲AI公司Mistral AI近日再次出手，推出了一款名为Devstral 2的全新开源编码模型家族，并配套了名为Mistral Vibe CLI的命令行工具。这套组合拳的出现，无疑为开发者群体带来了惊喜。Devstral 2号称能大幅提升编程效率，尤其是在自动化编程和代码理解方面。更令人瞩目的是，它在一项衡量真实世界代码修复能力的基准测试中，取得了接近顶级闭源模型的成绩，而且目前API免费开放，这对于广大开发者来说，无疑是一个重大利好。
双尺寸模型，满足不同场景需求
Devstral 2系列并非单一模型，而是提供了两种不同规模的版本，以适应多样化的应用场景。

Devstral 2 (123B): 这是家族中的旗舰型号，拥有1230亿参数。它被设计为企业级的“主力军”，特别擅长调用各种工具、处理多文件编辑以及深入探索复杂的代码库。在SWE-bench Verified这一权威测试中，它取得了72.2分的高分，在目前的开源模型中表现最为突出。
Devstral Small 2 (24B): 顾名思义，这是一个更轻量级的版本，拥有240亿参数。它的优势在于可以在消费级硬件上本地运行，并且支持图像输入。这使得它非常适合那些对数据隐私有严格要求，或者需要在离线环境下工作的用户。
这两款模型都采用了先进的Transformer架构，并支持长达256K token的上下文窗口，这意味着它们能够理解和处理更长的代码序列，从而在复杂任务中表现更佳。值得一提的是，Devstral 2采用了修改版的MIT许可协议，而Devstral Small 2则采用了更为宽松的Apache 2.0协议，两者均已开源，并且Devstral 2的API目前是免费提供的，这极大地降低了开发者尝试和使用的门槛。
SWE-bench实测：开源编码Agent新标杆
Devstral 2在SWE-bench Verified基准测试中的表现尤为抢眼。SWE-bench Verified是一个衡量AI模型在真实GitHub问题解决能力的测试集。Devstral 2在此取得了72.2%的得分，这意味着它能成功修复72.2%的真实代码问题。这一成绩不仅远超了市面上大多数同类开源模型，甚至逼近了那些由巨头公司推出的、参数量更大的闭源模型。
更具吸引力的是其出色的成本效益。相较于参数规模更大的闭源模型，Devstral 2在实现同等性能时，成本效率可能高出7倍以上。这对于需要大规模自动化编码任务的场景，比如代码重构、Bug修复、多文件协同修改等，无疑具有巨大的吸引力。
Mistral Vibe CLI：对话式编程新体验
与Devstral 2模型一同发布的，还有Mistral Vibe CLI，一个由Devstral驱动的开源命令行工具。它将AI编码助手直接带入了终端，让开发者可以通过自然语言与代码库进行交互。
这个工具的核心亮点在于其强大的代码理解能力。它能够扫描整个项目的文件结构和Git状态，提供精确的上下文信息。开发者可以通过简单的指令，比如使用@来引用文件，使用!来执行shell命令，或者通过斜杠指令进行自定义配置。它能够理解整个代码库的逻辑，而不仅仅是当前正在编辑的文件。
Mistral Vibe CLI还提供了持久化的对话历史、智能的自动补全以及可自定义的主题，极大地提升了交互的便捷性和用户体验。这意味着开发者可以像与一位经验丰富的同事交流一样，通过对话来完成代码的探索、修改和执行等一系列操作，真正实现了“端到端自动化编程”。
开放策略驱动AI编程普及
Mistral AI此次的发布，不仅在技术上取得了突破，更在策略上强调了开放与实用。Devstral 2系列模型已经与多家开源Agent平台进行了深度整合，使得开发者能够快速地将其接入到现有的工作流中。
Devstral 2系列模型既能满足企业级生产环境的需求，也为个人开发者提供了本地部署的选项，这有助于推动AI编码工具的普惠化。分析人士认为，Mistral AI凭借Devstral 2的高性价比和Mistral Vibe CLI的创新交互方式，有望加速“Vibe Coding”（对话式编程）潮流的兴起，并对现有闭源AI模型的市场格局带来新的挑战。开发者们现在就可以通过官方API或Hugging Face平台体验这些新工具。

理想你有吗

又来一个不用动脑就能用的？

huajuaneng

又来一个不用写代码的？累了，真的。

liliaishuo

这玩意儿倒是省事，以后代码都能瞎编了。