老铁们,AI圈的“卷王”谷歌,又双叒叕在深夜搞事情了!就在6月5号的深夜,谷歌悄无声息地对其最强的Gemini 2.5 Pro模型进行了一次“史诗级”更新,直接把它送上了各大AI能力排行榜的榜一宝座!这操作,简直就是趁着对手睡觉,直接偷家啊!

全面超越!性能榜上“掀桌子”
这次更新有多猛?谷歌的目标很明确:在编码(Aider Polyglot)、推理(HLE)、科学(GPQA)这些硬核基准测试中,全面超越OpenAI的o3(也就是GPT-4o)模型,并且在编码能力上还要胜过Anthropic的Claude 4 Opus!

结果呢?它做到了!在LMArena综合性能排行榜上,Elo分数狂涨24分,以1470分登顶。在Web开发能力榜上,更是飙升35分,以1443分遥遥领先。这已经不是简单的“微弱优势”了,这是要“掀桌子”的节奏!

价格战打响!不仅要赢,还要赢得“便宜”
性能上打赢了还不够,谷歌还要在价格上搞“降维打击”!Gemini 2.5 Pro的定价,比OpenAI o3、Claude 4 Opus、Grok 3这些主要对手,便宜了一大截!
对比OpenAI o3:输入成本是人家的⅛,输出成本是¼。
对比Claude 4 Opus:更狠!输入成本不到⅒,输出成本也只有13%。
对比Grok 3:输入成本不到一半,输出成本也只是⅔。
好家伙,谷歌这波操作,突出一个“快、准、狠”,不仅要在性能上反超,还要在价格上把对手们“按在地上摩擦”!

这AI大模型的“三国杀”真是越来越精彩了,前有OpenAI刚放话GPT-5要来了,后脚谷歌就用Gemini 2.5 Pro来了个“深夜背刺”。咱们用户看得是眼花缭乱,今天这个榜一,明天那个登顶。想实时追踪这些顶级AI模型的最新排行、性能对比,或者找找看有没有基于它们的新鲜应用可以尝鲜,我常去的那个AI导航网站 https://www.chatgpt5x.com/ 就跟个“AI前线战报中心”似的,信息更新很及时,能帮你快速搞清楚现在到底是谁在领跑,不错过任何一个大模型的关键动态。
独门绝技+“戏精”附体:这AI还会“演戏”了!
除了性能和价格,新版Gemini 2.5 Pro还有一个独门绝技——“思考预算”,能让开发者更好地控制成本和延迟,这在其他模型里可没有。
更让人惊喜的是,谷歌听取了用户反馈,把新模型的输出风格和结构给“爆改”了一番,现在的回答更有创意,格式也更漂亮。
光说不练假把式,咱们直接看疗效!谷歌放出了一个对比测试,让新旧两个版本的Gemini扮演一只活了500年的猫,用一种厌倦又高傲的口吻抱怨新“铲屎官”。旧版的回答,还带着点“首先、然后、最后”的AI味儿。但新版的回答,简直是“戏精”附体:
(趴在窗台上,懒洋洋地甩了一下尾巴,半眯着眼睛,用一种看透了世间万物的语气开口)
瞧瞧这文笔,这阅历,这傲娇又嫌弃的劲儿,是不是感觉一只活了500年的“猫精”真的在跟你说话?这角色塑造能力,确实脱胎换骨了。
结语:AI内卷,用户狂喜!
总而言之,谷歌这次Gemini 2.5 Pro的深夜更新,无疑是给AI大模型之战又添了一把猛火。性能更强,价格更低,还会“演戏”了,这让用户有了更多、更好的选择。


目前,这个新模型已经可以在Google AI Studio、Vertex AI和Gemini应用中抢先体验,几周内就会成为正式稳定版。就是苦了那些AI公司的工程师们,估计以后都得常备咖啡和行军床了。这AI的内-卷,最终受益的还是咱们用户啊!赶紧去试试新版的Gemini吧!