马斯克的“全球最强”AI正式亮相：Grok 4发布，剑指星辰与机器人

智享AI

7月9日，马斯克旗下的人工智能公司xAI投下了一枚重磅炸弹，正式发布其最新、最强大的旗舰AI模型——Grok 4。老马毫不掩饰其雄心，直接宣称Grok 4是“地表最强”AI，其性能是前代Grok 3的10倍，并在多项关键基准测试中超越了OpenAI的o3、Anthropic的Claude 4以及谷歌的Gemini 2.5 Pro。我们在智商排行榜中可以看到，Grok 4全面登顶：

这无疑是xAI向世界展示其技术实力和宏大愿景的宣言，告诉大家xAI的愿景并不是在吹牛：从无与伦比的推理能力到极具人性化的语音交互，再到设计火箭、赋能机器人的长远规划，Grok 4的发布也预示着AI竞赛将进入一个更加激烈的全新阶段。

核心亮点：压倒性的性能与独特的“多智能体”架构
Grok 4的强大首先体现在其惊人的性能参数上，拥有高达256,000个token的上下文窗口，这意味着它可以一次性处理和记忆海量的文本信息。这份底气来源于其背后强大的训练资源：一个由20万个H100 GPU组成的、名为“Colossus”的xAI定制超级计算机。

Grok 4推出了两种版本：

Grok 4：标准的单智能体模型。
Grok 4-Heavy：一个创新的多智能体（Multi-agent）模型，可以生成多个并行的推理线程，像一个专家团队一样协同解决复杂问题。
这种“多智能体”架构让Grok 4在推理能力上实现了质的飞跃。在极具挑战性的私有基准测试ARC-AGI v2中，Grok 4取得了15.8%的高分，是其最接近的竞争对手Claude 3.5 Opus的两倍多，也是近几个月来唯一突破10%大关的模型。此外，它在SAT、GRE等标准化考试中也取得了近乎完美的成绩，展示了其全面的学识和解题能力。

不止于强大：更“像人”的语音与无限的创意潜力
如果说强大的推理能力是Grok 4的“硬核”，那全新的高级语音模式赋予了它“灵魂”。

新模型引入了多个合成语音角色，如充满磁性的电影旁白声“Sal”和优雅的英国女性声音“Eve”。这些声音极大地提升了交互的人味儿，让用户感觉不再是与冰冷的机器对话。尤其是“Eve”，她能够自然地处理用户的打断，并根据提示即兴创作内容，在发布会演示中，她流畅地表演了一段关于“健怡可乐”的歌剧。

自新的语音模式上线以来，Grok的活跃用户增加了10倍，端到端的响应延迟也减少了一半，速度明显快于其他AI助手。

与此同时，xAI也提出了自己的创意路线图：2025年底：利用Grok编写并制作一部30分钟的电视剧，2026年：制作一部完全由AI生成的完整电影。

宏大愿景：从虚拟走向现实，赋能工程与机器人
马斯克对AI的构想从未局限于虚拟世界。Grok 4从训练之初就集成了代码、搜索和可视化等实用工具，其最终目标是成为连接数字世界与物理世界的桥梁。

xAI计划将Grok与先进的工程工具深度结合，未来有望实现：帮助工程师设计火箭、汽车等复杂工业产品。在生物医药领域，Grok的API已被用于辅助CRISPR基因编辑的研究。最终目标是将Grok强大的“大脑”与特斯拉的Optimus人形机器人集成，让机器人拥有理解、推理和执行复杂物理任务的能力。

开发者生态与未来规划
为了构建强大的生态，Grok 4一经发布便通过API向开发者开放。其强大的能力已被用于商业模拟、独立游戏开发等多个领域。

xAI还公布了清晰的迭代计划：

多模态能力：目前Grok 4对图像、音视频的理解能力有限，但重大升级即将到来。2025年7月将发布v7版本，显著提升多模态理解能力。
视频与3D生成：到2026年，Grok预计将能够生成3D游戏、交互式视频等实时媒体内容。
专业编码模型：预计在2025年7月底或8月初，xAI将推出一个专门的编码模型，进一步增强其在软件工程领域的实力。
如何获取
目前，用户可以通过订阅X Premium+来访问Grok 4。对于追求极致性能的专业用户和企业，可以每月支付300美元升级到性能更强的SuperGrok Heavy。

总而言之，Grok 4的发布代表了AI发展的一种趋势：在追求更强推理能力的同时，向着更自然的人机交互、更深入的产业结合以及最终的物理实体化不断迈进。

智享AI

卧草，老马屌～