摘要:华为准备测试旗下最新、最强大的AI 芯片昇腾(Ascend)910D,直接对标NVIDIA的高端AI芯片。消息人士透露,华为已开始接洽部分中国合作伙伴,讨论910D技术可行性的测试事宜。据悉,华为最快5月就能取得910D首批样本。当然, 一切尚在初期阶段,之后
据《华尔街日报》援引知情人士消息,华为准备测试旗下最新、最强大的AI 芯片昇腾(Ascend)910D,直接对标NVIDIA的高端AI芯片。消息人士透露,华为已开始接洽部分中国合作伙伴,讨论910D技术可行性的测试事宜。据悉,华为最快5月就能取得910D首批样本。当然, 一切尚在初期阶段,之后仍需要一系列测试来评估处理器性能,为供应客户做好准备。
华为期望,最新一代昇腾AI处理器的性能能超越NVIDIA 2022年发布的热门AI训练芯片H100。目前,华为已经推出910B、910C,性能较NVIDIA竞品尚有不小差距。4月早些时候,美国将特供中国市场的H20芯片加入出口管制名单,NVIDIA也因此认列55亿美元费用。这也让NVIDIA的中国竞争对手(诸如华为、寒武纪)有了更多国产替代的机会。
从“追赶”到“并跑”的跨越
910D的核心突破首先体现在算力指标上。据内部测试数据,其FP16算力达到800TFLOPS,较前代910B提升2.3倍,与H100的989TFLOPS差距缩小至20%以内。
更值得关注的是,在AI训练关键的TF32精度下,910D实现512TFLOPS算力,首次超越H100的495TFLOPS,这一突破意味着在Transformer等主流模型训练场景中,910D已具备替代H100的硬实力。
在能效比这一关键维度,910D通过第二代3D堆叠技术和液冷散热系统,将能效比提升至3.2TFLOPS/W,较H100的3.6TFLOPS/W仍有差距,但考虑到其采用更成熟的7nm工艺(H100为4nm),这一成绩足以证明华为在架构优化上的深厚功底。
内存系统方面,910D搭载64GB HBM3e内存,带宽突破3TB/s,较910B提升4倍,彻底解决大模型训练中的内存墙问题。
当然,910D最革命性的创新在于其全球首发的“达芬奇3.0”架构。该架构采用三维张量切割技术,将计算图动态分割为空间(Spatial)、通道(Channel)、时间(Temporal)三个维度,配合自研的“太行”指令集,使芯片在处理万亿参数模型时,计算资源利用率从H100的72%提升至89%。
在通信层面,910D集成华为自研的“星河”互联技术,单芯片支持128路PCIe 5.0通道,芯片间互联带宽达900GB/s,较NVLink 4.0的600GB/s提升50%。这一特性在构建千卡级集群时尤为重要,可使集群通信效率从H100方案的68%提升至82%,大幅降低训练损耗。
从“硬件孤岛”到“软件共生”
面对英伟达CUDA生态的长期垄断,华为在910D上推出“昇思3.0”AI框架,其最大创新在于支持“计算图自动编译”功能。
开发者只需用PyTorch编写模型,昇思即可自动将其转换为达芬奇架构最优指令流,使模型迁移成本降低80%。实测显示,在GPT-3 175B模型训练中,910D集群的代码改动量不足H100方案的15%。
在硬件生态构建上,华为展现出前所未有的开放姿态。910D不仅兼容主流的OAM 2.0模组标准,更通过“昇腾伙伴计划”,向寒武纪、燧原等友商开放底层接口。
这种“竞合”策略已初见成效:目前已有12家AI芯片厂商承诺适配昇思框架,中国AI算力生态正从“单兵突进”转向“军团作战”。
在市场方面,910D的推出正逢全球AI算力市场剧变之际。据IDC数据,2025年Q1中国AI服务器市场规模达38亿美元,其中昇腾系占比已升至32%,较2023年提升19个百分点。随着910D量产,华为有望在2025年底将市场份额推高至45%,直接威胁英伟达在华55%的市占率。
在商业落地层面,910D已获得多个标杆客户。百度智能云宣布将基于910D构建新一代AI训练平台,预计可使文心大模型训练成本降低40%;科大讯飞则计划用910D集群替代现有H100方案,在语音识别场景实现延迟从120ms降至78ms的突破。更深远的影响在于,910D的量产将打破英伟达对高端AI芯片的定价权,有望使H100售价从当前30万元/片回落至22万元区间。
算力自主背后的国运博弈
910D的突破绝非偶然。华为在AI芯片领域的持续投入,折射出中国在算力自主道路上的战略定力。
过去三年,华为将AI芯片研发预算提升至营收的22%,远超行业平均的15%。这种“饱和式投入”已形成技术代差优势:在最新的MLPerf训练榜单中,昇腾系在BERT、ResNet-50等主流模型训练中,性能较2023年提升3.8倍,而H100仅提升2.1倍。
更深层的战略意义在于,910D的量产将重塑全球AI产业链分工。随着中国AI企业逐步摆脱对美国芯片的依赖,全球AI创新中心或将呈现“东升西降”趋势。据预测,到2026年,中国将贡献全球60%的AI大模型训练需求,其中九成将运行在国产算力平台上。
站在AI时代的历史节点,910D的诞生标志着中国在高端AI芯片领域实现从“跟跑”到“并跑”的历史性跨越。
来源:咫尺观察