2025年4月16日,OpenAI推出了其最新的O系列人工智能模型——o4-mini,与更高级的o3模型一同亮相 (CNBC)。o4-mini专为快速、成本效益高的推理任务设计,在编码、数学和视觉任务中展现出卓越性能。
核心功能与性能

多模态推理能力
o4-mini的一个突出特点是其“用图像思考”能力。它不仅能识别图像,还能将视觉信息直接融入推理过程,处理包括白板草图、PDF图表甚至低质量图像在内的多种视觉输入。例如,它可以对图像进行缩放、旋转或分析,显著提升了视觉任务的处理能力 (TechCrunch)。
高性能与成本效益
o4-mini在性能测试中表现出色,在SWE-bench验证测试中得分68.1%,远超前代o3-mini的49.3% (TechCrunch)。其设计注重速度和成本效益,开发者定价为每百万输入令牌1.10美元,每百万输出令牌4.40美元。这种高效性使其成为资源有限但需要高性能AI的用户的理想选择。
安全与可靠性
o4-mini经过OpenAI最严格的安全测试,符合其准备框架(Preparedness Framework)的要求,确保在金融、医疗和法律等敏感领域的可靠性 (CNBC)。
可用性:
o4-mini现已对OpenAI的Pro、Plus和Team计划用户开放,支持Chat Completions API和Responses API,方便集成到各种应用中 (TechCrunch)。
变体:
除了标准o4-mini外,还有“o4-mini-high”变体,通过更长时间的答案生成提高可靠性。
上下文处理:
支持高达200K令牌的长上下文处理,适合复杂任务 (GitHub Changelog)。
结论
o4-mini是OpenAI在高效AI推理领域的里程碑之作。它以低成本、高性能和多模态能力为核心,为开发者和企业提供了强大的工具。无论是解决复杂的编码问题、分析视觉数据,还是支持创意项目,o4-mini都展现了其在现代AI应用中的巨大潜力。