摘要:Llama 曾是 Meta 最具野心的 AI 作品:在 ChatGPT 和 PaLM 占据主流话语权的 2023 年,Meta 用一篇重量级论文和一组开放权重的大语言模型,意外地把开源阵营推上主舞台。而那时,Meta 的 AI 科研团队 FAIR(Fundam
大数据文摘出品
2025年,Llama 的缔造者正在离开 Meta。
他们大多去向了 Mistral,这家总部位于巴黎的 AI 初创公司,正在用“开源速度”反攻 Meta 自己开启的战场。
Llama 曾是 Meta 最具野心的 AI 作品:在 ChatGPT 和 PaLM 占据主流话语权的 2023 年,Meta 用一篇重量级论文和一组开放权重的大语言模型,意外地把开源阵营推上主舞台。而那时,Meta 的 AI 科研团队 FAIR(Fundamental AI Research)也正处于高光时刻。
那篇震惊行业的论文:https://arxiv.org/pdf/2302.13971
但两年后,这条路线似乎走到了一个岔口。
Meta 官方尚未对“人才流失”作出正面回应,社交平台 X 上已经有一些讨论。目前,14 位在 Llama 论文中署名的研究者,目前只剩 3 位仍在 Meta。有人形评论:Meta 打开了一条通往开源未来的路,却眼睁睁看着建路的人转身离开,另起炉灶。
01 一条持续的人才迁徙线
从 LinkedIn 记录看,Llama 团队的出走并非一朝一夕,它悄然展开于 2023 年初,至 2025 年初几近完成。
最早一批离开的,是 Meta 内部资深研究员 Guillaume Lample 和 Timothée Lacroix。他们几乎是 Llama 架构的奠基者,离职时间分别是 2023 年年初和 6 月。随后,他们在巴黎创立了 Mistral AI。
图注:Timothée Lacroix、Arthur Mensch和Guillaume Lample 是Mistral AI公司的联合创始人。其中Lacroix与 Lample 曾参与撰写Meta公司原始Llama论文。图片来源于businessinsider,由Khanh Renaud/ABACAPRESS.COM提供。侵删
接下来的一年半内,包括 Marie-Anne Lachaux、Thibaut Lavril、Baptiste Rozière 等多位 Llama 作者陆续加入这家初创公司。如今,Mistral 的研究骨干中,有一整支前 Meta 团队。
而其他人也未偏离 AI 一线战场。有人去了 Anthropic、DeepMind、微软 AI,也有人加入了 Kyutai、Cohere 等二线研究机构。
他们平均在 Meta 任职超过五年,绝非“打工人式的流动”。这更像一次认知的重构——那些曾深度参与 Meta AI 体系设计的人,正在以离职的方式,表达自己的方向选择。
02 Meta 的开源理想,走得比公司战略更快
Meta 推出 Llama 时,用了一个不小的策略跳跃:它不再将模型封闭运行,而是开放权重、共享参数,允许开发者在单张 GPU 上复现最前沿模型。这在彼时是对 OpenAI 和 Google 的商业闭环思路的一次反向挑战。
从技术上说,Llama 的设计确实更轻、更高效。它在资源消耗上做了权衡,不依赖大量私有数据,跑得也更快。这些“实用主义”的工程美学,正契合了开源社区的理想主义愿景。
但问题是:当理想走得太快,公司战略未必跟得上。
Llama 模型在开发者间收获大量好评,Llama 2 更是成为 HuggingFace 上最受欢迎的模型之一。但从 Llama 3 到 Llama 4,业界的情绪开始转变。“不够新”“进展慢”成为越来越多人的反馈。尤其在 DeepSeek、Qwen 等新势力爆发式迭代之后,Meta 逐渐掉队。
而更严重的警讯是,Meta 迟迟没有推出类似 GPT-4 Turbo、Gemini Pro 这样具备“推理能力”的模型版本。这意味着,在多步推理、链式调用、外部工具整合等下一代语言模型方向上,它已经落于人后。
《华尔街日报》甚至报道说,Meta 正在推迟其内部最大规模模型 Behemoth 的发布,因团队对其性能与领导方向存在分歧。
一边是慢下来的产品节奏,一边是熟悉 Meta 技术路线的核心研究员大量出走,Meta 显得前后受敌。
03 FAIR 的隐退与“新 FAIR”的建立
过去一年,Meta 内部还有一个关键变化:领导 FAIR 八年的 Joelle Pineau 宣布辞去职务,其位置由 Robert Fergus 接替。这位新领导者曾在 DeepMind 任职五年,也是 FAIR 的早期联合创始人。
FAIR 曾是 Meta 研究自信的核心:2014 年创立,曾在图神经网络、机器翻译、多模态学习等多个前沿领域发表影响深远的成果。Llama 正是 FAIR 的巅峰之作。
但如今,这支队伍核心团队已散,方向也在变。
过去,FAIR 的基调是“开放 + 共享”;如今,Meta 对“应用”和“效率”的关注似乎压倒了科研的探索热情。在这样一组矛盾中,很多研究员选择离开,也就并不难理解。
如果只看人事层面,Meta 的这波人才外流可以被视作“正常的团队更替”,但事实显然不止如此。
Mistral 并不只是吸收前 Meta 员工的公司,它已经是 Meta 的直接竞争对手。在多项模型评测中,Mistral 的 Mixtral 和 Tiny Mistral 凭借参数规模与效果平衡,击中了市场的“可部署模型”需求。而这些成果,大多由前 Meta 团队主导。
这使 Meta 处于一个尴尬位置:它定义了开源大型模型的第一章,但第二章正在被别人书写。
04 Mistral:一支从 Meta 出走的队伍
图注:Mistral AI 官网截图
Mistral AI爆发式增长始于 2023 年,创立仅一个月便完成超 1 亿美元的种子轮融资,并在之后的一年内迅速拉起多个大模型家族。
Pixtral 面向多模态,Medium 3 瞄准 STEM 和编程任务,“Les Ministraux”则优化边缘部署。
新近上线的 OCR API 和阿拉伯语模型 Saba,表明其产品策略已不再局限于英语语境或科研模型,而是在更广泛场景中主动扩张。
但这场扩张背后,挑战也显而易见。
图注:techcrunch 关于Mistral 60亿估值的报道
首先是“影响力与变现能力不对称”的困境。虽然聊天助手 Le Chat 在法国一度超越 ChatGPT 登顶 App Store 下载榜,但根据多方消息,Mistral 的营收仍停留在千万美元级别。这对于一家估值 60 亿美元的公司而言,仍远不足以支撑 IPO 或摆脱被收购的猜疑。
模型“开放性”立场的自我张力也受限。Mistral 在早期以 Apache 2.0 协议开源模型著称,但进入商业化阶段后,其主力模型的权重并未公开,只保留部分“研究版本”可自由使用。这种“两轨制”的策略虽可兼顾营收与声誉,却也招致部分开源社区的质疑:它是否正在变得越来越“闭源化”?
第三个隐忧则是国际扩展能力。虽然 Mistral 与法国军方、AFP、Stellantis、IBM、Helsing 等达成战略合作,并与 NVIDIA、Bpifrance 在巴黎筹建 AI 校区,但其用户群体和生态建设仍以欧洲市场为主。相比之下,OpenAI 和 Google 已在全球构建起完整的 API 平台、开发者工具链及消费级产品矩阵,具备更强的粘性和护城河。
总结下来,Mistral 的团队规模、融资额和模型能力已经达到一级梯队水准,但在全球化运营、基础设施建设、以及长期生态搭建上,它还需要更多时间证明自己。来源:大数据文摘