摘要:英伟达(NASDAQ:NVDA)最近发布了其新系列Blackwell Ultra和 Rubin 芯片,相信它们将引领下一波人工智能投资浪潮。如果生成式人工智能是第一个,那么推理式人工智能将是第二个,这些芯片似乎考虑到了这些架构。本质上,Blackwell 是
英伟达(NASDAQ:NVDA)最近发布了其新系列Blackwell Ultra和 Rubin 芯片,相信它们将引领下一波人工智能投资浪潮。如果生成式人工智能是第一个,那么推理式人工智能将是第二个,这些芯片似乎考虑到了这些架构。本质上,Blackwell 是 2024 年发布的 2024 Blackwell 型号的涡轮增压版。这些芯片提供的一些最大好处是内存带宽大幅增加,单个 GPU 上的内存带宽从 192GB 飙升至 288GB。实际上,这使得这些 GPU 能够处理更大的人工智能模型,从而使它们能够高效处理密集型工作负载。它们对于训练深度学习应用程序也更加实用。
这些芯片的另一个主要特点是,除了拥有更大的内存之外,它还建立在 Blackwell 的“基于图块”的设计之上,而 Ultra 系列旨在进一步增强这一设计,使性能比其前代产品提高约 1.5 倍。
Rubin 将于 2026 年发布,将取代 Blackwell,由一对芯片组成。它们由一个名为 Vera 的定制 Arm CPU组成,旨在并行工作。这是 AI 进化的又一步,因为它取代了当前的 Grace CPU + GPU 设置,用于将 AI 集成到不同的工作负载中。与 Blackwell 一样,Rubin 还将采用基于 Tile 的设计,可容纳四个 Tile,这意味着它可以在单个封装内扩展多个芯片。
随着人工智能变得越来越普遍,这种“基于区块”的模块化设计将成为常态。它本质上允许用户“混合搭配”不同类型的芯片以适应特定的工作负载。例如,人工智能区块可能具有张量核心,而通用区块可能具有基于 Arm 的核心。通过将它们组合在一起,可以使它们更加灵活,并适应各种行业。
Rubin 设计的整体情况是,据估计,AI 系统可以达到每秒50 千万亿次浮点运算的 AI 推理速度,比目前的 Blackwell 芯片高出约 2.5 倍。展望 2027 年,也就是 Rubin Ultra 发布之时,英伟达计划将两个 Rubin GPU 融合在一起,目标是实现每秒 100 千万亿次浮点运算的速度和 1 兆字节的板载内存,这将大大加速 AI 的发展。
新的 Blackwell Ultra 和 Rubin 芯片不仅大幅提升了 AI 性能,而且也旨在提高推理能力。如果没有与其能力相匹配的互补推理,就无法拥有复杂的 AI 推理模型。对高速推理的需求变得比以往任何时候都更加迫切,AI 被集成到越来越多的新设备中。
这之所以重要,是因为人工智能中的传统推理通常依赖于静态模型执行,类似于运行简单的编程脚本,尽可能简单地说。但人工智能推理需要更复杂、更动态的内存密集型计算,这些计算通常需要实时调整。例如,自动驾驶汽车需要根据新的输入不断更新其理解,这与以前的推理有很大不同,以前的推理通常以确定性的方式运行人工智能策略。
新款 Blackwell Ultra 在这方面的优势主要来自于内存的大幅增加,每个 GPU 从 192GB 增加到 288GB,适合多步逻辑计算。一些推理模型,如 OpenAI 的 o1、Grok-3 或 DeepSeek (DEEPSEEK) 的 DeepSeek-R1,每秒消耗的令牌数量比前几代高出许多,这意味着推理也必须扩大规模才能满足需求。
另一方面,Rubin 允许 AI 模型将工作负载分配到不同的处理单元。与仅使用 GPU 的推理(在并行处理方面表现出色,但在顺序或逻辑驱动任务上表现不佳)不同,Rubin 提供了一种混合方法。这种集成至关重要,因为推理不仅需要 GPU 中的原始能力,还需要理解(并记住)上下文、决策和顺序处理。为了大大简化问题,AI 模型将能够将逻辑任务卸载到 CPU,同时使用 GPU 进行计算。这使得英伟达的 AI 堆栈具有高度适应性,确保它可以在同一芯片内以更高的效率和功耗处理需要巨大 GPU 能力的传统工作负载以及逻辑决策。
随着这些芯片的发布,英伟达现在已经牢牢占据了AI 加速器市场的主导地位,以及数据中心计算的市场份额,已经为大约 90% 的数据中心工作负载提供支持。这进一步提高了竞争对手在计算方面挑战它的门槛,这也有助于证明其高估值和成为世界上最有价值的公司之一的合理性。
为了更全面地了解这些性能影响,Blackwell Ultra 的 HGX 系统声称,与上一代 hopper 系统相比,该系统可为 AI 模型提供11 倍更快的 AI 推理速度和 7 倍更高的吞吐量。因此,有人认为英伟达的护城河正在被谷歌、亚马逊等公司及其它主要超大规模企业所瓦解,这些企业正在创建自己的 AI 芯片,因此英伟达需要满足更高的标准。
这些芯片的第二个含义是,英伟达首席执行官黄仁勋最近宣布,“推理和代理 AI”的新拐点已经到来,而之前对 LLM 的关注可能不再是未来几个月和几年 AI 圈讨论的“热门话题”。据称,Blackwell Ultra 是专门为这个“推理时代”量身定制的,因为它具有额外的能力和板载内存,可以思考思考过程的每一步。
这些影响是巨大的。英伟达基本上打开了潘多拉魔盒,通过这些强大的 GPU 和 CPU 将人工智能和人工智能干扰融入日常应用中,现在可以比以往更经济地进行训练。它正在从一家硬件公司或芯片制造商转变为硬件和软件之间的关键接口。这意味着,虽然目前它的大部分计算都是从数据中心出租的,但在未来几年,它似乎也将被用于从仓库到医院和电信网络的各种应用。如果有人怀疑英伟达的主导地位正在逐渐消失,这一发展为相反的观点提供了可靠的证据。
英伟达的几家同行正在凭借自己的芯片在市场上取得进展。需要注意的是,像谷歌和亚马逊这样的超大规模公司主要制造针对其自身生态系统优化架构的芯片。这些公司并不是想侵占英伟达的核心市场,而是创造完全适合高效利用资源以满足自身需求和 AI 模型的替代方案。
例如,谷歌一直在创建自己的 TPU来加速机器学习任务。而亚马逊的 Trainium 和 Inferentia芯片则推出了用于训练和性能的定制 AI 芯片。亚马逊通常遵循削价定价策略,因此我预计这些芯片的价格也将具有竞争力。
现实情况是,许多开发人员和客户不需要昂贵的英伟达GPU(他们通常按小时租用),而主要好处最终是节省时间(除非模型训练任务巨大,而且他们可能会坚持使用英伟达,从而使更便宜的模型的优势变得毫无意义)。
AMD也凭借其 Instinct MI300X 取得了重大进展,该产品旨在成为英伟达解决方案的更便宜的替代品。值得注意的是,微软和Meta等公司已经开始将 MI300X 集成到其数据中心,这意味着 AMD 正在取得进展。
与此同时,微软和 Meta也在开发自己的芯片,这既是出于战略原因,也是出于财务原因。目前,英伟达基本上控制着整个供应链,相信 Majestic 7 的其余部分不会支持这种对利润丰厚的 AI 市场的控制。
然而,就目前情况而言,这些芯片都是为满足特定工作负载而定制的,或旨在完全削弱英伟达。到目前为止,还没有一家公司试图成为“下一个英伟达”或创造更出色的 GPU。他们都遵循着自己独特的战略,所以现在威胁看起来很小,但肯定正在出现。但无论如何,即使这些公司有自己的芯片,英伟达也已经将软件锁定在 CUDA 和用于 AI 训练和推理的众多集成软件中。对于竞争对手来说,这些库需要从头开始构建和维护,即使对于一整个经验丰富的软件工程师团队来说,这也是一项艰巨的任务。此外,目前没有其他 GPU 足够强大,能够及时且经济高效地训练下一代 AI 模型。超大规模企业目前的举动似乎更像是成本优化和多样化的衡量标准,而不是完全取代英伟达,而其 Blackwell Ultra 和 Rubin 版本继续表明它是 AI 基础设施的黄金标准。没有公司试图超越英伟达的领先地位,因为目前这样做完全是徒劳的,相反,他们试图进行不对称竞争,或者只是提供更便宜的替代品。就竞争而言,英伟达目前似乎继续称王,并占据 AI 基础设施市场的最大份额。
Blackwell Ultra 的每次部署价值高于前几代产品。英伟达新的基于 GB300 的 AI 工厂(使用 Blackwell Ultras)就是这方面的一些证据。它允许在一个机架中扩展多达72 个 GPU以进行推理。由于这些“AI 工厂”在内存和吞吐量方面都表现出色,它们估计可以比基于上一代 Hopper 芯片的工厂产生高达 50 倍的收入。像 AWS、谷歌和微软这样的超大规模企业将迅速购买这些最新芯片,因为它们追求自己的 AI 愿景,此外还会购买自己的芯片进行专门优化。但新一代英伟达芯片最棒的一点是,它们还发布了与之交互的软件,例如Dynamo 推理网络框架。这意味着英伟达可以提供硅片以及类似于亚马逊 AWS 的高利润软件销售,以充分利用这波已经出现并快速增长的新一波推理 AI。
这些新芯片显然瞄准了新一轮人工智能投资浪潮,旨在实现推理和推论,这让看跌者大吃一惊,这是人工智能领域的长期和高信念投资。看跌者一直在寻找英伟达可能和将会失败的方式,而这始终表明英伟达一直处于领先地位。
过去三个月英伟达股价的下跌是非理性的,且出于恐惧。关税和其他地缘政治因素不会改变人工智能的论点。如果说有什么不同的话,那就是现在是买入英伟达的绝佳时机,只希望它跌得更多。
英伟达被低估有几个原因,即分析师预测 AI 数据中心的发展空间将达到“万亿美元”,而英伟达正处于其中间。一些估计认为,这个发展空间大约需要 10-20 年,而且这只是我们能预见的近期情况。随着 AI 模型变得越来越智能(我认为我们大多数人都已经看到 ChatGPT 等 AI 模型呈指数级增长),可以合理地假设 Nvidia 的估值也会随之上升。
该公司最近的业绩也带来了约 73-75% 的巨额毛利率。这意味着该公司可以凭借 Blackwell Ultra 和 Rubin 等芯片继续保持领先地位,并继续占据主导地位。
目前看来,英伟达势不可挡,它的抛售与该公司无关,因为整个市场目前都在遭受冲击。然而,尽管这些新芯片降低了竞争对手和超大规模企业发布自有芯片的吸引力,但这才是行业最终的发展方向,尤其是对于非常先进的人工智能应用而言。例如,如果像谷歌或亚马逊这样的公司不只是想要,而且需要定制芯片来实现最高效率并集成到他们的应用中,那么他们就会开发它,这至少会让英伟达出局。这究竟意味着什么尚不得而知,但看看其他超大规模企业如何利用自己的芯片将是一个关键的风险管理因素。
此外,虽然英伟达迎合了大多数“高端”市场的需求,但它这样做忽视了长尾市场,而 AMD 等公司生产的价格更便宜、竞争力越来越强的芯片更适合长尾市场。这些长尾应用包括大学实验室进行的实验或单个开发人员训练小众模型。单独来看,这些应用加起来不算多,但随着人工智能越来越普及,如果英伟达不能满足更多预算端市场的需求,这可能是一个错失的机会,但这可能是一个以后可以解决的问题。
如果看涨者需要确认人工智能革命尚未达到顶峰或处于泡沫之中,并且英伟达在这方面仍是王者,那么Blackwell Ultra 和 Rubin 芯片的发布应该会给他们信心,让他们以相对便宜的价格买入英伟达。它的护城河正在扩大,并且它在保持人工智能军备竞赛的领先地位方面表现出了极大的一致性。
来源:新浪财经