摘要:上周圈子里疯传这句话,说的是英伟达H20在中国扑街,性能拉胯、价格离谱,直接被自家砍单。
“296 TFLOPS,连游戏卡都嫌慢。”
上周圈子里疯传这句话,说的是英伟达H20在中国扑街,性能拉胯、价格离谱,直接被自家砍单。
现在替补队员B30A来了,据说用Blackwell架构,性能摸到H100的边,成本还比H20低一大截。
一句话:老黄准备拿更便宜的核弹,砸国产AI饭碗。
真有这么吓人?
把H20翻出来再看一眼,296 TFLOPS,听起来数字不小,可训练大模型的人一算,每块钱能买到的算力还不如上一代。
加上CUDA生态绑得死,客户想换国产,得把整套代码重跑一遍,时间成本直接劝退。
于是H20成了仓库里的烫手山芋,英伟达干脆停产止损。
B30A的杀招是“单die”——把原来分散的小芯片拼成一整块,良率上去,散热下来,省下的都是真金白银。
性能对标H100,价格却可能贴着国产卡打,这招最狠:你卖一万,我卖九千九,还顺手送你成熟软件栈。
国产厂商现在最缺的不是技术,是时间。
模型迭代一天一个版本,客户等不起。
更麻烦的是,B30A还没上市,小道消息已经满天飞:
“首批货优先给互联网大厂,折扣低到骨折。”
“老黄亲自飞深圳,饭局里放话:谁买国产,明年配额减半。”
真假没人敢赌,但焦虑是真的。
国产卡也不是没活路。
去年某家做推理芯片的小厂,干脆把算子库开源,社区里一群程序员连夜适配Stable Diffusion,跑图速度反超英伟达三成。
他们赌的是细分场景,不做通用训练,专啃边缘推理,避开正面战场。
听起来像游击队,可战争里最先活下来的,往往是游击队。
另一个路子是“捆绑服务”。
有家初创公司把芯片和算法打包,卖给做直播的中小平台,直接送一年模型托管。
客户不用管CUDA还是ROCm,插上电就能用。
这招土,但管用,毕竟多数人只想让直播间美颜不掉帧,谁管你芯片姓英还是姓中。
英伟达的算盘打得响,可别忘了还有变量。
美国出口清单随时可能加戏,万一哪天B30A也被卡脖子,提前囤货的代理商哭都来不及。
国产厂现在最该做的,是把软件栈磨到“无痛迁移”,让客户今天用英伟达,明天能一键换国产。
真做到这一步,B30A再便宜,也只是多一个选项,而不是唯一答案。
说到底,芯片战跟菜市场抢摊位没两样:
谁先占住客流,谁就能活下去。
英伟达想用低价清场,国产卡就得用更快的迭代、更贴地气的服务,把客户拽回来。
至于最后谁赢?
得看谁先让程序员少加一次班,让老板少掏一分钱。
评论区留给你们:
如果B30A真卖骨折价,你会为了CUDA闭眼冲,还是给国产卡一次机会?
来源:雪地中踏行的归人