基座大模型头部玩家,只剩下“南阶跃,北智谱”

摘要:中国的AI大模型市场如火如荼,但激烈的竞争也使得一级市场的VC攥紧了钱袋子。从业界的反馈看,关注的焦点大多集中在“六小强(智谱、阶跃星辰、MiniMax、月之暗面、零一万物、百川智能)”身上。

中国的AI大模型市场如火如荼,但激烈的竞争也使得一级市场的VC攥紧了钱袋子。从业界的反馈看,关注的焦点大多集中在“六小强(智谱、阶跃星辰、MiniMax、月之暗面、零一万物、百川智能)”身上。

01

“基座双雄”格局初定

业界有“南阶跃、北智谱”的说法,与智谱并称为“基座双雄”的阶跃星辰是最为低调的,既很少对外官宣融资,也很少对外披露团队信息,因此外界对其含金量也莫衷一是。

不过昨天市场上传出一个惊讶的消息,阶跃星辰完成了 B 轮融资,虽然没有透露具体金额,但据说总融资额达到了数亿美元,VC寒冬下,这是非常罕见的大手笔。此外,投资阵容也极为豪华,既有国资,也有战略和财务投资人,包括上海国有资本投资有限公司及其旗下基金,腾讯投资、五源资本、启明创投等。

如果你有印象,上周智谱官宣完成最新一轮 30 亿人民币的融资。当时不少人认为,这可能是 2024 年大模型领域最后一笔融资,万万没想到,阶跃突然放了个大招。

虽然没有透露本轮融资的估值,但从智谱的情况来看,估计二者都跨过了200 亿估值的门槛,能够支撑起高强度研发的消耗战,进一步拉开与后排公司的距离。可以理解为,未来的国产大模型,将是阶跃与智谱的“基座双雄”格局。

02

国资为什么看中了阶跃?

千万年来,生物沿着不同的方向进化,大模型领域也是如此。“六小强”中,MiniMax 主打出海,月之暗面主打 C 端产品,百川智能转向医疗等垂直领域。在基座大模型赛道,只有智谱与阶跃坚持追求基座大模型的预训练与效果提升,同时积极探索商业模式。

既然百花齐放,为什么我认为AI大模型方向是最有潜力的?

因为大模型的 C 端产品走的互联网流量逻辑,只有三条路:要么胜出,要么死掉,要么转型。这个赛道的玩家太多了,大厂也纷纷入局,早期是很难预见到谁会胜出,确定性并不高。

相比之下,研发通用基座大模型的公司,会有更广阔的市场空间。因为大模型是AI产业的基座,所有的AI之花必须开在大模型的土地上。此外,海外限制日益收紧,自主可控是大方向,大模型是AI时代的“水电煤”,必须掌控在中国人自己手里,这为大模型创造了天然的竞争壁垒。

因此,投资方中拥有国资背景的大模型创业公司,是这一逻辑下的最佳选择。

来看一下投资人背景。

智谱的国有投资方包括了中关村科学城公司(海淀区旗下平台)、北京市人工智能产业投资基金,主要是北京国资。阶跃的核心投资方则包括上海国有资本投资有限公司及其旗下基金。

北京跟上海各押了一个宝,这两家能获得的资源,与其它公司肯定不是一个量级的。

在一级市场愈加冷静的大环境下,智谱与阶跃还能拿到融资,除了两个团队的技术实力使然,也与大模型的“自主可控”逻辑、国资背书有关。显而易见,如果赌上市,阶跃与智谱的可能性是最高的。

坊间传言,阶跃跟上海的国资企业合作关系非常深厚。

那么,国资为什么看中了阶跃与智谱?

有一说一,很多大模型公司已经掉队了,当前第一梯队中,只有阶跃与智谱仍追求基座大模型的效果提升,也只有这两家最像 OpenAI。

死磕基座大模型,意味着坚持 AGI,才能支撑起更高上限的资本故事和商业化空间。从成果发布来看,智谱依旧在对标 OpenAI 推出新模型,而从年底国际权威榜单 LiveBench 与 LMSYS 来看,阶跃星辰的模型水平也是国内为数不多能与 OpenAI、Anthropic 等国际顶尖大模型公司一较高下的。

03

阶跃的人才与速度

角逐基座大模型,是一件投入成本高、技术挑战大的事情,独角兽智谱这个竞争对手更不是吃素的。即便如此,阶跃依然能得到投资方的认可(本轮有不少老股东续投,比如启明创投),说明实力不可小觑。

一开始我也很纳闷,后来查了一下阶跃的技术团队,才明白过来。

阶跃的CEO是曾担任微软全球副总裁的姜大昕博士,他是自然语言处理领域的全球知名专家,在机器学习、数据挖掘、自然语言处理和生物信息学等领域拥有丰富的研究及工程经验;他曾带领团队开发了微软必应搜索引擎,负责网页排序、智能问答、知识图谱卡片,图片和视频搜索结果。国际电气和电子工程师协会(IEEE)刚公布了2025年度Fellow名单,姜大昕博士是唯一来自中国大模型创业公司的入选者,入选理由是:对上下文感知搜索和语言Scaling方法做出的贡献。

阶跃星辰的核心成员还包括曾任字节跳动总监的朱亦博,他也是国内少有的拥有丰富大规模集群与系统建设经验的AI系统专家;公司数据和算法方面的核心成员,则包括出身微软STCA的焦斌星,以及ResNet作者之⼀的AI科学家张祥⾬。

这些都是业界赫赫有名的大拿,之前阶跃都是“藏在深闺”不对外透露的。我简单说一下他们的情况。

张祥雨在微软亚洲研究院期间,共同完成了著名的ResNet,张祥雨负责底层框架和编码。去年这项研究获得了2023未来科学大奖“数学与计算机科学奖”。目前这篇论文Google Scholar的被引用次数已超23万,是本世纪最火的深度学习论文之一。

朱亦博任职字节跳动期间,负责公司AI基础设施与基础AI框架,开始积累大规模集群的搭建经验;2022年底,他跳槽至Google任高级主管,直接支持OpenAl最大劲敌、Claude的背后公司Anthropic。

这些大拿加盟阶跃后,取得了什么战绩?

简单列举一下吧,阶跃是2023年4月成立的新公司,过去10个月里竟发布了 11 款基座模型,迭代的速度飞快。阶跃的 Step 系列大模型矩阵覆盖了从千亿参数到万亿参数、从语言到多模态、从理解到生成的全方位能力。

刚刚过去的 11 月,Step-2在「最难 LLM 评测榜单」LiveBench 上成为唯一进入榜单前十名的中国语言大模型,位列全球第五,超越了 GPT-4o 和 Gemini-1.5,拿下中国第一。

当时同样上榜的大模型还有通义千问和DeepSeek,但均没有冲进前十,分别位列第十三和第二十三名。估值超过 200 亿人民币的第一梯队大模型公司中,除了阶跃星辰外,其它均没有上榜。

这是个技术为王的时代,要想拿到融资必须有干货。从这个豪华的技术团队来看,换作是我,肯定也会投阶跃啊。

总的来说,AI大模型的竞争看似乱花渐欲迷人眼,但仔细梳理下来发现,真正具有高确定性的也就那么一两家罢了,而阶跃正是怎么也绕不开的一家。

死磕基座大模型+国资加持+豪华技术团队,阶跃把“龙珠”都集齐了,难怪可以争取到国家队资金的支持。感觉从这轮融资开始,阶跃有了更足的底气甩开膀子干了,会是大模型市场当之无愧的重要一极。

来源:公子豹

相关推荐