特斯拉AI芯片战略升级,“史诗级”芯片接棒Dojo

360影视 动漫周边 2025-09-09 10:05 1

摘要:电子发烧友网报道(文/黄山明)近期,特斯拉CEO马斯克在社交媒体上发文称,特斯拉AI5芯片设计团队已完成出色的设计评审,并表示这款芯片将成为“史诗级”产品,并且接下来推出的AI6也有望成为迄今为止最好的AI芯片。

电子发烧友网报道(文/黄山明)近期,特斯拉CEO马斯克在社交媒体上发文称,特斯拉AI5芯片设计团队已完成出色的设计评审,并表示这款芯片将成为“史诗级”产品,并且接下来推出的AI6也有望成为迄今为止最好的AI芯片。

就在8月份,特斯拉宣布关闭自研超级计算机Dojo团队,原负责人Peter Bannon离职。马斯克解释称,同时开发训练与推理芯片导致资源分散,集中力量开发单一架构更高效。AI5/AI6将替代原有双轨策略,通过统一架构实现训练与推理的平衡,同时降低开发与维护成本。

“史诗级”的AI芯片

2024年6月,马斯克突然在社交媒体上透露了下一代自动驾驶芯片的细节,并表示不会被称为HW5,而是被称为AI5,并且马斯克还表示,这项技术将在2025年下半年应用在汽车上。

到了2025年9月,这款AI5芯片也再次进入到了公众的视野中。马斯克再次在社交媒体中提及,并表示已经与AI5芯片设计团队进行了设计评审,表示这是一款史诗级的芯片,并且透露未来将推出的AI6有望成为迄今为止最好的AI芯片。

对于AI5的定位,马斯克表示对于参数数量低于2500亿的模型而言,AI5就是所有类型推理芯片中最好的,其成本也是如今最低的,性能、功耗比也是最好的。

马斯克曾透露,AI5芯片的性能有望达到HW4的十倍。而HW4的单芯片算力为200-250TOPS,因此AI5算力有望达到2000-2500TOPS左右。使用INT8精度,峰值功率可达800W。

这一算力水平,将使得AI5可以支持更加复杂和高效的无监督学习算法,并且该芯片也将被用于特斯拉的全自动驾驶系统。这款芯片交由台积电代工,采用台积电的N3P工艺,前期先在台湾进行生产,后续将在其位于亚利桑那州的工厂生产,不过量产的时间被推迟至2026年。

除了AI5外,其透露的AI6更是被称为最好的AI芯片,这款芯片将成为特斯拉未来AI生态的核心。并且就在不久前,特斯拉与三星签署了一项价值165亿美元的协议,为AI6芯片提供技术支持。

并且三星也在准备其位于得克萨斯州泰勒的工厂,用以满足特斯拉的需求,马斯克本人也计划将亲自参观该工厂,让未来特斯拉的AI芯片实现完全的美国本土化制造。

AI6也是特斯拉投入大量资源的一款产品,预计其应用范围从为FSD和特斯拉的Optimus人形机器人提供动力,到为数据中心提供高性能AI训练。

马斯克曾在社交媒体上直白的表示,一旦明确所有路径都将汇聚到AI6,就不得不关闭Dojo,并且做出一些艰难的人事选择,因为Dojo 2如今已成为一条进化的死胡同。可以说,未来Dojo 3将以主板集成大量AI6芯片的形式延续。

因此在今年8月,特斯拉解散了Dojo超级计算机团队,专注于支持自动驾驶汽车和机器人实时决策的推理芯片。

马斯克认为,同时展开两款截然不同的AI芯片,如专注于超算训练的Dojo与专注于推理应用的AI5/AI6,不仅是浪费资源,而且毫无意义。未来,特斯拉将会把所有精力集中在AI5/AI6芯片上。

从Dojo到超级AI芯片

2019年,马斯克在特斯拉自动驾驶日首次提出Dojo概念,定位为利用海量视频数据训练自动驾驶神经网络的超级计算机,强调其摆脱对英伟达GPU依赖的目标。

2021年,特斯拉Dojo超级计算机正式推出,这一项目也代表特斯拉利用其全球汽车的PB级数据来训练全自动驾驶(FSD)的雄心壮志。Dojo基于专有的D1芯片构建,目标是为了实现超过亿亿次浮点运算的计算性能,用来加速神经网络训练。

市场中对于特斯拉的这个项目也非常看好,有分析师根据其颠覆数据中心计算市场的潜力,将Dojo估值定位5000亿美元。

而自研D1芯片采用7纳米工艺,单芯片浮点运算能力达到22万亿次。当3000个D1芯片组成ExaPod计算集群时,总算力高达1.1EFLOPS,这一数据可谓震惊业内。

但不过短短六年时间,2025年8月,马斯克便宣布解散Dojo团队,负责人Peter Bannon离职,约20名核心工程师加入DensityAI,该公司由Dojo前负责人Ganesh Venkataramanan等人创立。其余特斯拉员工将被调配至特斯拉的其他数据中心或计算相关项目。特斯拉转向外部采购英伟达H200 GPU和三星代工的AI6芯片,彻底放弃自研Dojo路线。

解散Dojo团队,一方面在于马斯克已经认识到Dojo其封闭的技术路线,以及与行业主流背道而驰,当英伟达Drive Thor芯片通过开放的生态吸引20多家车企合作时,Dojo智能服务于特斯拉内部,这导致其单位算力成本居高不下。

更糟糕的事兼容性困境,D1芯片摒弃传统缓存层级,依赖软件优化数据局部性,导致编程难度剧增;同时,片外HBM带宽与本地SRAM的性能鸿沟加剧了调度复杂性,工程师需要额外花费40%时间进行数据转换和适配,在自动驾驶模型越来越复杂的当下,这种低效变得难以接受。

与此同时,特斯拉在近几年的芯片采购与算力资源商越来越倚重外部企业,包括英伟达、AMD、三星电子等,均向其供应高端GPU、AI芯片与制造支持,让特斯拉无须独自承担全部研发及硬件建设费用,依旧可以维持强劲的AI训练性能。

此时,AI5、AI6芯片,恰好契合特斯拉的发展方向,未来通过AI6进行推理,并将训练任务外包至云端,从而在不牺牲性能的前提下降低成本。

过去,特斯拉一直坚持的目标是尽量减少对第三方GPU的依赖,但随着Dojo的关闭,以及对AI5、AI6系列资源的倾斜,证明特斯拉在这一技术路线上已经由完全封闭走向了符合市场的商业化道路。

总结

过去的特斯拉,一直处于“双线并行”的研发道路,带来的后果是资源分散、节奏滞后于成本的攀升,这已经抵消了Dojo原本许诺的30倍训练加速优势。加上外部环境的变化,采用AI5/AI6芯片,用用单一架构同时吃掉训练+推理市场,是特斯拉当下更具商业性的选择。

来源:核芯产业观察

相关推荐