xAI解散,但Grok还在上新,马斯克官宣新模型

2026-05-27 00:25:01 莘语岚 莘语岚 / 莘语岚

机器之心编辑部 自从 xAI 解散、大批创始成员离职之后,大家都在关心一个问题:Grok 是不是要凉了

文章配图-1

机器之心编辑部

自从 xAI 解散、大批创始成员离职之后,大家都在关心一个问题:Grok 是不是要凉了?

事实证明,并没有。就在昨天,马斯克对外透露了 Grok 最新模型的进展。据他介绍,参数量达 1.5T 的 Grok 基础模型 V9-Medium 已经完成训练,评估结果不错。

文章配图-2

目前,模型正在进行微调,几天后将启动强化学习阶段。按照计划,Grok V9-Medium 预计会在两到三周内公开发布。

马斯克表示,这将是一次重大升级。他此前承认,现在承载所有 Grok 生产流量的、参数量仅 0.5T 的 v8-small(外部测试版本 Grok 4.2)在训练数据的质量、全面性和比例上存在严重缺陷。新的 Grok V9-Medium 不仅将参数规模扩大到前代的 3 倍,还针对 Blackwell 架构 GPU 进行了专门优化。在各项能力上,新模型都会有显著提升,尤其是在处理复杂编程任务方面。

他还表示,现有的 0.5T 模型计划在本年底前开源,适合开发者本地运行、微调或构建应用。

文章配图-3

值得一提的是,在后续的补充训练中,团队加入了大量来自 Cursor 的数据,并且这一数据源还会继续扩充。

这得益于马斯克豪掷千金的一场收购。今年 4 月份,SpaceX 官方宣布,已获得在今年晚些时候以 600 亿美元收购 Cursor 的权利。当时,这一举动还让外界有点困惑,质疑 Cursor 是否真的值那么多钱。

但是,也有人认为,Cursor 是开发者实际使用的 AI 代码编辑器,数据包含真实的工作流(写代码、调试、迭代、修复 bug 等),是「人类开发者如何思考」的映射,其价值非常独特。如果 Grok 新模型能够有效利用这些数据,那么它将更懂真实开发者的工作方式,而非只是 GitHub 上的公开代码。

文章配图-4

文章配图-5

文章配图-6

除了新模型,马斯克近期推出的首款编码智能体 Grok Build 也是备受关注。你可以把它理解成马斯克版「Claude Code」—— 一个直接跑在你命令行里的 AI 程序员,能读代码、做计划、改文件、跑测试。

文章配图-7

它比较明显的差异化设计是 Plan Mode(计划模式)。你描述需求后,它不会直接乱改你的代码,而是先输出一份结构化的执行计划,列明每一步要做什么。你可以审阅、修改甚至重写整个计划,批准之后它才开始动手,所有改动以 diff 形式呈现。

文章配图-8

其他关键功能还包括:并行子智能体(最多支持 8 个子智能体同时工作)、Arena Mode(让多个候选方案内部「打擂台」)、原生支持 MCP 和 ACP、 支持无界面运行等。

目前,Grok Build 在开发者群体中已经收获了一些好评。

文章配图-9

文章配图-10

在 Grok Build 之前,终端原生编程智能体这个赛道已经有三个主要玩家:Anthropic 的 Claude Code、OpenAI 的 Codex CLI、Google 的 Gemini-powered Antigravity。Grok Build 的加入,把这场竞赛从三强变成了四强。

有意思的是,马斯克此前公开承认过 xAI 在编程能力上落后,所以 Grok Build 的发布更像是一次「补课式入场」—— 功能架构上快速追平对手,再用 Arena Mode 这种差异化机制试图弯道超车。

不过目前的 Grok Build,底层跑的还是 grok-code-fast-1,具有 256K-token 的上下文窗口,在竞争对手面前显然不够看的。对于大型单一代码库和长时间运行的 Agent 会话,这样的上下文长度显然会成为瓶颈。

Grok V9-Medium 的 1.5T 参数和 Cursor 真实工作流数据的注入,有望让整个工具拥有更强大的底层模型。

在未来的 Agent 战局中,马斯克的团队能否占据一席之地?我们拭目以待。