摘要:NVIDIA公司正加紧布局我国AI芯片市场,据最新传闻,其即将推出的Blackwell B30A芯片将采用双芯片(dual-die)设计,专为遵守美国出口管制而优化。这款芯片基于先进的Blackwell架构,预计性能将远超当前的H20模型,但仅为旗舰B300的
NVIDIA公司正加紧布局我国AI芯片市场,据最新传闻,其即将推出的Blackwell B30A芯片将采用双芯片(dual-die)设计,专为遵守美国出口管制而优化。这款芯片基于先进的Blackwell架构,预计性能将远超当前的H20模型,但仅为旗舰B300的一半左右,旨在平衡合规与竞争力。消息来源包括GF Securities的分析报告以及X平台上的业内爆料,预计B30A将于2025年第四季度正式发布,首批样品可能最早在9月交付给我国客户。行业专家指出,这一设计不仅是工程上的创新,更是NVIDIA在中美科技博弈中的战略调整,预计将帮助其在我国AI基础设施市场重夺份额,面对本土巨头如华为和阿里巴巴的强势挑战。
这一传闻的曝光,迅速在科技圈引发热议。X平台上,用户讨论焦点集中在B30A的性能潜力与出口审批的不确定性,许多人认为这标志着NVIDIA正从“被动合规”转向“主动优化”。与此同时,我国政府推动本土芯片自给自足的政策,正让NVIDIA的每一步都备受关注。下面,我们来详细拆解这款芯片的技术细节和市场影响。
英伟达的GPU芯片(图片来源于网络,侵删);
B30A芯片的核心亮点在于其双芯片架构,这与NVIDIA全球旗舰B300的配置相似,但进行了针对性调整。根据GF Securities的报告,B30A将使用TSMC的N4P工艺节点制造,配备8层HBM3E高速内存,总容量达141GB,支持NVLink互联技术,带宽高达900GB/s。这种设计让芯片在AI训练和推理任务中表现出色,预计FP4浮点运算性能达7.5 PetaFLOPS,远高于H20的水平。
双芯片(dual-die)意味着B30A将两个计算芯片通过高速互连桥接,形成一个统一的GPU单元,这比H20的单芯片(single-die)设计更高效。工程上,这种架构源于Blackwell的微架构升级,包括2080亿晶体管和自定义TSMC 4NP工艺,能实现2倍注意力层加速和1.5倍AI计算FLOPS提升。相比H20(基于旧Hopper架构,核心数减少41%,性能降低28%),B30A的内存容量增加46%(从96GB到141GB),互联速度更快,适合大规模AI模型训练,如大型语言模型(LLM)。
然而,为符合美国出口规定,B30A的性能被有意限制在B300的50%左右。这包括减少计算核心和优化功耗,避免超过管制阈值。NVIDIA CEO黄仁勋在财报电话会议中表示:“我们评估各种产品路线图,以在政府允许的范围内竞争。”X平台爆料显示,B30A的定价预计在2万至2.4万美元,是H20的两倍,首批出货可能在数周内启动,需求强劲。
从工程洞察来看,双芯片设计解决了单芯片在高密度计算中的瓶颈问题。NVIDIA的Transformer Engine支持微张量缩放(micro-tensor scaling),优化4位浮点(FP4)AI精度,确保在有限性能下仍保持高效。但挑战在于热管理和制造成本——TSMC的CoWoS-S封装技术虽更经济,但双芯片互连需精密控制,以防信号延迟。相比之下,华为Ascend 910C的本土设计在能效上更贴合我国数据中心需求,这让B30A的竞争压力不小。
H20是NVIDIA当前在我国唯一获批的AI芯片,基于Hopper架构,专为出口管制“阉割”版设计:核心数减少、性能打折,仅96GB HBM3内存。B30A作为其继任者,将在Blackwell架构加持下,实现显著升级——预计AI训练速度提升30%以上,推理任务更高效。报告显示,B30A的单芯片变体(早期传闻)性能约B300的50%,但最新消息确认双芯片配置,能进一步拉大与H20的差距。
然而,出口合规是B30A的最大考验。美国商务部需批准其销售,特朗普政府虽在7月恢复H20出口(NVIDIA支付15%营收作为许可费),但对Blackwell的审批仍不确定。黄仁勋表示:“将Blackwell带到我国市场的机会真实存在,但需政府点头。”X上业内人士指出,B30A的“负面增强”设计(性能削减30-50%)正符合特朗普的暗示,这或将成为突破口。
英伟达的芯片性能对比(图片来源于网络,侵删)
在我国AI芯片市场,B30A的传闻正值关键节点。2025年上半年,我国AI计算资源需求激增,市场规模预计达500亿美元,但美国管制让NVIDIA份额从2023年的高点下滑至13%。本土企业趁机发力:华为Ascend 910C已用于训练本土AI模型,阿里巴巴的自研芯片直接对标H20,性能相当且成本更低。政府政策要求国有数据中心芯片本土化比例超50%,这进一步挤压外资空间。
NVIDIA的策略是“定制+合规”:B30A不仅针对AI训练,还计划推出RTX6000D变体,专注推理任务。预计2025年第四季度首发后,B30A将助力我国云服务商如阿里云和腾讯云升级基础设施,维持NVIDIA的生态主导。X讨论显示,用户对B30A的期待高涨,但也担忧审批延误——若获批,NVIDIA或重夺20%市场份额;否则,本土芯片如华为的将加速替代。
从市场洞察看,2025年全球AI芯片需求将翻番,我国占比超30%。双芯片设计的B30A代表了“管制下创新”的趋势,推动行业向高效、低功耗转型。但NVIDIA需警惕供应链风险——TSMC产能紧张,可能推高B30A价格。长远而言,继任者Rubin R30预计2028年登场,将进一步深化这一布局。
英伟达的芯片性能对比(图片来源于网络,侵删);
B30A的双芯片设计,不仅是NVIDIA工程实力的展示,更是其在全球AI竞赛中求生的智慧之举。预计第四季度发布后,这款芯片将重塑我国数据中心格局,助力AI模型如大语言模型的本土训练。但审批不确定性和本土竞争,将考验NVIDIA的韧性。科技界拭目以待——在中美科技摩擦中,B30A能否成为转折点?
B30A的Blackwell双芯片架构,在N4P工艺和HBM3E内存支持下,标志着AI芯片向模块化、高带宽演进;市场趋势下,2025年我国AI基础设施投资将超1000亿元,NVIDIA的合规模拟或助其稳固领先,但本土自研浪潮正加速,本土企业需抓住机遇,实现弯道超车。
来源:万物云联网