
—
谷歌正式推出Gemini 2.5 Flash-Lite稳定版,这款专为高性价比设计的人工智能模型将开发者使用成本压缩至新低点。 即日起,企业只需支付每百万输入token 0.10美元、输出token 0.40美元的费用即可调用该服务,较行业标杆GPT-4.1 Nano更具价格竞争力。
此次迭代最显著的突破在于成本控制。相比早期预览版,音频输入处理费用直降40%,而百万token级别的上下文处理能力仍得以保留——相当于单次可解析近700页技术文档。开发团队通过架构优化,在维持多模态理解、代码执行等核心功能的同时,成功将资源消耗压缩到前代产品的三分之一。
在实际应用中,工程师通过指定"gemini-2.5-flash-lite"模型标识即可调用新版本。该模型原生集成三大实用工具:实时联网检索谷歌搜索结果、直接执行代码片段、以及网页URL内容解析,大幅降低复杂任务的实现门槛。基准测试显示,其数学推导与编程能力已全面超越Gemini 2.0版本。
技术迁移窗口正在关闭。 谷歌确认预览版服务入口将于8月25日终止,开发者需在此之前完成模型切换。新版API特别引入"可控计算预算"机制,允许用户根据任务复杂度动态分配算力资源,避免不必要的资源浪费。
随着主流AI模型进入"成本攻坚"阶段,谷歌此次价格策略折射出行业新趋势:当技术参数逐渐趋同,服务可用性正成为竞争主战场。降低开发门槛的轻量化模型,或将重塑企业级AI应用的落地路径。
注:Gemini是谷歌推出的多模态AI模型体系,Flash系列定位轻量级推理场景,适用于高频次、低延迟的生产环境。本次发布的Lite版本在保持128K常规上下文基础上,通过技术优化实现百万token的特殊处理能力。