摘要:他是谷歌 Gemini-0801 的共同创造者,这是谷歌首个在 LMSYS 上登顶的模型。同时是 Gemini 2.5 系列模型的评测专家,这些模型在 WebDev Arena 和 HLE 等榜单上取得了第一名。他还是谷歌 Gemini 1、1.5、2 和 2
大厂之间不是「你挖我」,就是「我挖你」。
那边特斯拉 Optimus AI 团队负责人 Ashish Kumar 被挖去 Meta,这边谷歌 DeepMind 资深研究科学家被 xAI 挖走了。
马斯克发推祝贺,并用火箭符号喊话:「起飞啦」!
此次,被挖去 xAI 的是一名在谷歌 DeepMind 工作近 9 年的大神级人物 ——Dustin Tran,离职前担任资深首席研究员。
他是谷歌 Gemini-0801 的共同创造者,这是谷歌首个在 LMSYS 上登顶的模型。同时是 Gemini 2.5 系列模型的评测专家,这些模型在 WebDev Arena 和 HLE 等榜单上取得了第一名。他还是谷歌 Gemini 1、1.5、2 和 2.5 的核心贡献者之一,其工作涵盖了强化学习、评测与数据等基础环节,并共同主导了相关论文与成果发布。
他在 X 上发表了一篇公开离职信,全文如下:
我在谷歌 DeepMind 工作 8 年多后选择了离开。这里留下了许多美好的回忆,最初在 Google Brain 参与早期奠基性的论文,与 Noam Shazeer、Ashish Vaswani、Lukasz Kaiser 合作完成 Image Transformer、Tensor2Tensor、Mesh TensorFlow。
后来主导 Gemini 的后训练评测,在 100 天内完成追赶并成功发布,带领团队登上 LMArena 榜首,并保持了一年多;最后参与 Gemini 在推理方面的突破性创新,与 Heng-Tze Cheng、Quoc Le 合作在 IMO 与 ICPC 中夺得金牌。
Gemini 的旅程是一场从一个范式到另一个范式的狂野转变。一开始,我们重塑了 LaMDA 模型(第一个类指令的聊天机器人),从一个简单的对话机器人进化到能够通过 RLHF 生成长篇、有内容的回答;接着,通过在长链思维、全新环境和奖励头上的训练,推动推理与深度思考的能力。刚开始时,外界的舆论非常糟糕,几乎所有人都觉得谷歌会因为搜索的历史包袱和组织政治而注定失败。
如今,Gemini 在用户偏好上稳定占据第一,并引领新的科学突破。大家又觉得谷歌获胜是理所当然的。过去 OpenAI 还常常靠着在我们发布之前,从他们的想法储备中抢先宣布消息来抢占 AI 舆论周期。但现在可以说,那些储备已经见底了。
现在,我已经加入了 xAI。原因众所周知:算力、数据以及大约一百位聪明且勤奋的人,就足以训练出前沿级的大语言模型。xAI 对此深信不疑。
算力方面,即便在谷歌,我也从未见过人均拥有如此数量的芯片。随着 Colossus 2 的上线,xAI 还将迎来超过 10 万块 GB200 与 30 万块芯片的投入使用。数据方面,Grok 4 在强化学习和后训练的规模化上做出了最大押注。xAI 还在数据扩展、深度思考与训练范式方面进行新的尝试。
整个团队行动极其迅速,没有任何一家公司能够在如此短的时间内达到 xAI 今天在 AI 能力上的水平。正如马斯克所说,「一家公司创新速度的一阶与二阶导数最为重要:xAI 的加速度是最高的。」
我很高兴地宣布,在加入 xAI 的前几周,我们就发布了 Grok 4 Fast。Grok 4 是一款出色的推理模型,依然在 ARC-AGI 和 FinSearchComp 等新基准上保持领先。不过,它运行较慢,而且从未真正面向通用用户需求。Grok 4 Fast 则是最优秀的小型模型之一,在 LMArena 上排名第 8(而 Gemini 2.5 Flash 仅排第 18)。在 AIME 等核心推理评测中,它的表现与 Grok 4 相当,但成本却降低了 15 倍。
根据 Dustin Tran 的领英资料,他本科毕业于加州大学伯克利分校,此后原本在哈佛大学读统计学博士,但之后转到了哥伦比亚大学读计算机科学博士。
他在 2017 年加入谷歌,直到最近离职加入 xAI。
来源:新浪财经