摘要:Gemini核心开发者Dustin Tran昨日官宣跳槽xAI!马斯克也已转发推文确认。在谷歌的8年,从Gemini 1到最新尚未公布的Gemini,背后都有他的身影。他的到来,能为Grok带来哪些变化?
新智元报道
【新智元导读】Gemini核心开发者Dustin Tran昨日官宣跳槽xAI!马斯克也已转发推文确认。在谷歌的8年,从Gemini 1到最新尚未公布的Gemini,背后都有他的身影。他的到来,能为Grok带来哪些变化?
Gemini核心开发者Dustin Tran,昨天官宣从谷歌DeepMind跳槽到xAI,研发新一代Grok!
马斯克也于第一时间转发推文,确认了这位新同事的加盟xAI消息属实:
从官宣中得知,Dustin Tran已经加入xAI至少几周了,参与了Grok 4 Fast的开发,但直到今天才修改自己的对外头衔介绍,甚至慢于马斯克转发推文。
这也被眼尖的网友发现并调侃了:
Dustin Tran的新同事,xAI创始成员,同时也是之前从谷歌DeepMind跳槽过来的Toby Pohlen,也于第一时间转发推文欢迎新同事:
也有网友关心竞业条款带来的限制:
加州禁止竞业条款,得以让人才能在公司间自由流动,这也被普遍认为是加州的创新活力源泉的重要保障。
Dustin Tran,Gemini核心开发者
Dustin Tran,是Gemini从诞生之初到最新模型的核心开发者。
2014年,他毕业于加州大学伯克利分校,取得数学与统计本科学位,随后进入哈佛大学攻读统计学博士学位,两年后又转入哥伦比亚大学攻读计算机科学博士,并于2018年取得了博士学位。
他目前的论文总引用量已超过2.4万。
他也在读博期间斩获了包括谷歌博士奖学金在内的多项大奖:
他的工作履历相当简洁:2017年在OpenAI研究岗实习,同一年进入谷歌大脑研究岗实习并留任长达8年。
在官宣离职的长推文中,他饱含深情地回顾了在谷歌的8年工作,从混沌中摸索出霸榜的Gemini的心路历程,以及因为xAI的海量算力而选择加入xAI:
我正式告别谷歌DeepMind,结束了8年的旅程。这一路有满满的美好回忆——从最早在谷歌大脑参与一些奠基性的论文(和 @noamshazeer、@ashvaswani、@lukaszkaiser 一起做 Image Transformer、Tensor2Tensor、Mesh TensorFlow),到后来负责Gemini的后训练评测,在100天内追赶并上线;接着带领团队实现跃升,拿下LMArena第一(并稳居榜首一年多!);最后还参与了Gemini在IMO和ICPC上斩获金牌的推理创新(和 @HengTze、@quocleix 一起)。
Gemini的旅程跌宕起伏,不断经历范式的转变:最初,我们改造了LaMDA模型(第一个类指令式的聊天机器人!),让它从单纯的聊天机器人进化为能通过RLHF给出更长、更有内容的回答;之后,我们探索通过长链条思维训练、新颖环境和奖励头来增强推理和深度思考能力。刚开始时,外界普遍并不看好,很多人觉得谷歌会因为搜索的历史包袱和内部政治而注定失败。但如今,Gemini不仅在用户偏好上长期稳居第一,还不断推动新的科学突破,大家反而觉得谷歌赢是理所当然的 。(以前每次谷歌有新成果时,OpenAI 总会靠积压的想法先一步发布,从而抢占 AI 的新闻周期;但可以说,他们的「库存」如今已经耗尽了。)
之后我加入了xAI。秘诀其实很清楚:算力、数据,以及大约 O(100) 个聪明又拼命努力的人,这就是拿下前沿级大语言模型所需的一切。xAI对此 真的 深信不疑。在算力方面,即使在谷歌,我也从没见过这种「人均芯片」的规模(而且Colossus 2上还有10 万+的GB200/30 万+的GB300即将到来)。在数据方面,Grok 4做出了RL和后训练规模化的最大押注。xAI现在则在数据扩展、深度思考和训练配方上下注。团队行动也极其迅速——在这么短的时间里,没有任何一家公司能在AI能力上达到 xAI 现在的水平。正如@elonmusk 所说,一家公司的一阶和二阶导数才是最关键的:xAI的发展势头是最快的。
我很兴奋地宣布,在加入的头几周,我们就推出了Grok 4 Fast。Grok 4是一个出色的推理模型,依然在ARC-AGI和新基准(如 FinSearchComp)上排名第一。但它运行较慢,本来也不是面向通用用户需求的。而Grok 4 Fast则是最好的轻量级模型之一——在LMArena上排名第 8(Gemini 2.5 Flash是第 18!),在核心推理评测(如 AIME)上,它能与Grok 4比肩,同时成本却低15倍。特别感谢 @LiTianleli、@jinyilll、@ag_i_2211、@s_tworkowski、@keirp1、@yuhu_ai_。
Gemini如今取得如此亮眼的成绩,也让我们对Dustin Tran能为Grok 5带来的惊喜多了一份期待。
Colossus 2的海量算力
召唤一个强大的Grok 5
我们在此前的文章中,也对马斯克在紧锣密鼓地建设中的Colossus 2进行了详细剖析:
Colossus 2的海量算力,体现着马斯克毫不掩饰的野心:实现AGI乃至ASI,是Grok 5乃至xAI更后面的模型要追求的目标。
马斯克作为世界首富,要用天文数字般的算力,让所有对手望而却步。
最顶级的算力,吸引了最顶级的人才。
建设断档式强大AI的所有生产要素,马斯克一样也不想落下。
让我们拭目以待,Dustin Tran的加盟,能为我们带来多么强大的Grok 5。
参考资料:
来源:新浪财经