微软对NPU的痴迷对英伟达的AI PC雄心有何影响?

360影视 2025-01-20 20:30 2

摘要:英伟达在人工智能基础设施领域处于领先地位,特别是在数据中心。然而,面对即将到来的人工智能个人电脑(PC)时代,局势变得复杂。微软计划在2024年推出更多增强AI功能的Windows特性,这些特性仅适用于符合Copilot+标准的PC,要求配备高性能的神经处理单

英伟达在人工智能基础设施领域处于领先地位,特别是在数据中心。然而,面对即将到来的人工智能个人电脑(PC)时代,局势变得复杂。微软计划在2024年推出更多增强AI功能的Windows特性,这些特性仅适用于符合Copilot+标准的PC,要求配备高性能的神经处理单元(NPU)。目前,高通是唯一满足该标准的处理器供应商,其他如英特尔和AMD的产品也逐渐符合要求。尽管英伟达的GPU在性能上表现出色,但由于微软对NPU的专注,其产品未能满足相关标准。随着NPU的普及,开发者面临选择:是使用英伟达的推理微服务还是追求更广泛的市场。尽管面临竞争,英伟达在AI生态系统中的地位仍然重要,尤其是在应用程序的训练方面。

英伟达被广泛视为人工智能基础设施的领军者,尤其是在数据中心领域。然而,当我们将目光转向人工智能个人电脑(PC)时,局势却变得不那么明朗。随着2024年初的到来,Windows将越来越多地与增强人工智能的功能和体验相结合。一些突出的功能包括实时字幕和翻译、在Microsoft Paint中的图像生成能力,以及颇具争议的Recall功能,它定期捕捉屏幕截图以跟踪用户活动。

目前,这些创新功能仅限于被称为Copilot+的PC。要被归类为此类设备,计算机必须符合微软的最低性能基准。根据微软的规格,Copilot+ PC需要具备能够每秒执行40万亿次或更多INT8人工智能操作(TOPS)的神经处理单元(NPU),以及至少16GB的RAM和256GB的存储空间。在这一倡议启动时,高通是唯一一家满足微软NPU要求的处理器供应商,因此只有配备高通芯片的PC才能运行上述增强人工智能的功能。

自最初发布以来,其他公司也纷纷加入竞争,英特尔的Lunar Lake和AMD的Strix Point与Halo处理器系列如今也符合Copilot+ PC的标准。然而,即使在2025年CES上英伟达发布了售价2000美元的RTX 5090,宣称其AI计算能力超过3.3 petaFLOPS(在FP4下),仍然未能满足微软严格的标准。尽管英伟达的GPU能够实现令人印象深刻的FLOPS和TOPS,微软目前仅认可NPU用于此目的。

英伟达在人工智能PC领域并没有闲着。围绕人工智能PC的市场营销主要集中在微软的Copilot+规格上,这一点可以理解,因为如今几乎每台出售的PC都在运行Windows。这种在PC软件生态系统中的主导地位凸显了微软对NPU的重视。然而,英伟达在将人工智能功能整合到PC中方面已积极行动多年。负责英伟达Windows AI产品营销的杰西·克莱顿(Jesse Clayton)指出,该公司早在2018年就开始推动PC上的人工智能,推出了首款配备专用人工智能硬件的GeForce GPU,即张量核心(tensor cores)。他们还推出了DLSS,这是一项利用人工智能提升游戏性能的技术,通过生成像素和帧来实现。

虽然有人可能会争论Copilot+的实际价值,但微软无疑迫使芯片设计师创造符合其标准的NPU,从而建立了机器学习性能的新基准。鉴于Windows的市场份额可观,以及微软在其软件中持续整合人工智能,NPU很可能会迅速普及,甚至在预算配置中也会出现。此外,微软的DirectML和ONNX Runtime等框架的采用简化了应用开发,使得代码能够在多种硬件配置上以最小的调整运行。

尽管英伟达在独立显卡市场当前占据主导地位,但随着NPU在专注于构建人工智能应用的开发者中逐渐获得关注,它面临潜在挑战。英伟达的GPU仅出现在约18%的售出PC中,大多数系统依赖于英特尔、AMD或其他制造商的集成显卡。开发者将很快需要决定是加快使用英伟达推理微服务(NIMs)发布应用,还是追求更广泛的市场覆盖。尽管英伟达未来可能会面临来自NPU的竞争,但人工智能PC的细分市场意味着并非所有消息都是悲观的。即便应用程序无法在英伟达的硬件上运行,它们很可能是在英伟达的GPU上训练的,从而保持了该公司在生态系统中的相关性。

来源:老孙科技前沿

相关推荐