7月9日,马斯克旗下的人工智能公司xAI投下了一枚重磅炸弹,正式发布其最新、最强大的旗舰AI模型——Grok 4。老马毫不掩饰其雄心,直接宣称Grok 4是“地表最强”AI,其性能是前代Grok 3的10倍,并在多项关键基准测试中超越了OpenAI的o3、Anthropic的Claude 4以及谷歌的Gemini 2.5 Pro。我们在智商排行榜中可以看到,Grok 4全面登顶:
这无疑是xAI向世界展示其技术实力和宏大愿景的宣言,告诉大家xAI的愿景并不是在吹牛:从无与伦比的推理能力到极具人性化的语音交互,再到设计火箭、赋能机器人的长远规划,Grok 4的发布也预示着AI竞赛将进入一个更加激烈的全新阶段。
核心亮点:压倒性的性能与独特的“多智能体”架构
Grok 4的强大首先体现在其惊人的性能参数上,拥有高达256,000个token的上下文窗口,这意味着它可以一次性处理和记忆海量的文本信息。这份底气来源于其背后强大的训练资源:一个由20万个H100 GPU组成的、名为“Colossus”的xAI定制超级计算机。
Grok 4推出了两种版本:
Grok 4:标准的单智能体模型。
Grok 4-Heavy:一个创新的多智能体(Multi-agent)模型,可以生成多个并行的推理线程,像一个专家团队一样协同解决复杂问题。
这种“多智能体”架构让Grok 4在推理能力上实现了质的飞跃。在极具挑战性的私有基准测试ARC-AGI v2中,Grok 4取得了15.8%的高分,是其最接近的竞争对手Claude 3.5 Opus的两倍多,也是近几个月来唯一突破10%大关的模型。此外,它在SAT、GRE等标准化考试中也取得了近乎完美的成绩,展示了其全面的学识和解题能力。
不止于强大:更“像人”的语音与无限的创意潜力
如果说强大的推理能力是Grok 4的“硬核”,那全新的高级语音模式赋予了它“灵魂”。
新模型引入了多个合成语音角色,如充满磁性的电影旁白声“Sal”和优雅的英国女性声音“Eve”。这些声音极大地提升了交互的人味儿,让用户感觉不再是与冰冷的机器对话。尤其是“Eve”,她能够自然地处理用户的打断,并根据提示即兴创作内容,在发布会演示中,她流畅地表演了一段关于“健怡可乐”的歌剧。
自新的语音模式上线以来,Grok的活跃用户增加了10倍,端到端的响应延迟也减少了一半,速度明显快于其他AI助手。
与此同时,xAI也提出了自己的创意路线图:2025年底:利用Grok编写并制作一部30分钟的电视剧,2026年:制作一部完全由AI生成的完整电影。
宏大愿景:从虚拟走向现实,赋能工程与机器人
马斯克对AI的构想从未局限于虚拟世界。Grok 4从训练之初就集成了代码、搜索和可视化等实用工具,其最终目标是成为连接数字世界与物理世界的桥梁。
xAI计划将Grok与先进的工程工具深度结合,未来有望实现:帮助工程师设计火箭、汽车等复杂工业产品。在生物医药领域,Grok的API已被用于辅助CRISPR基因编辑的研究。最终目标是将Grok强大的“大脑”与特斯拉的Optimus人形机器人集成,让机器人拥有理解、推理和执行复杂物理任务的能力。
开发者生态与未来规划
为了构建强大的生态,Grok 4一经发布便通过API向开发者开放。其强大的能力已被用于商业模拟、独立游戏开发等多个领域。
xAI还公布了清晰的迭代计划:

多模态能力:目前Grok 4对图像、音视频的理解能力有限,但重大升级即将到来。2025年7月将发布v7版本,显著提升多模态理解能力。
视频与3D生成:到2026年,Grok预计将能够生成3D游戏、交互式视频等实时媒体内容。
专业编码模型:预计在2025年7月底或8月初,xAI将推出一个专门的编码模型,进一步增强其在软件工程领域的实力。
如何获取
目前,用户可以通过订阅X Premium+来访问Grok 4。对于追求极致性能的专业用户和企业,可以每月支付300美元升级到性能更强的SuperGrok Heavy。

总而言之,Grok 4的发布代表了AI发展的一种趋势:在追求更强推理能力的同时,向着更自然的人机交互、更深入的产业结合以及最终的物理实体化不断迈进。