AI芯片新势力中昊芯英,与央企强强联合,国产算力发展将向何处去

360影视 欧美动漫 2025-08-11 19:28 3

摘要:2025年世界人工智能大会(WAIC)近日落下帷幕,作为全球AI及信息科技领域的顶级盛会,WAIC吸引了来自全球800余家企业、3000余项前沿技术同台亮相。其中,“华北算力新引擎:国产自研GPTPU芯片变革AI算力效能”专题活动尤为引人注目,获得《人民日报》

从单点突破到体系化布局,中昊芯英为国产AI芯片突围带来何种启示?

2025年世界人工智能大会(WAIC)近日落下帷幕,作为全球AI及信息科技领域的顶级盛会,WAIC吸引了来自全球800余家企业、3000余项前沿技术同台亮相。其中,“华北算力新引擎:国产自研GPTPU芯片变革AI算力效能”专题活动尤为引人注目,获得《人民日报》《中国日报》等多家主流媒体的关注报道。数据猿亦作为科技媒体代表之一,现场见证了中昊芯英、天津移动、太极股份、博众数智联合启动“天津移动TPU智算中心点亮仪式”,此举有望推动国产AI算力实现从自主创新向生态协同的持续演进。

随着人工智能进入“AI+”时代,大模型、具身智能等前沿技术飞速发展,算力已成为数字经济的核心生产力,同时国际地缘政治的复杂性给芯片供应链带来了巨大的不确定性,使得“国产替代”成为确保国家科技竞争力的必然选择。国家 “东数西算” 工程、《算力基础设施高质量发展行动计划》等政策持续推动算力基础设施集约化、智能化发展。

在这场国产算力的新浪潮中,唯有深耕核心技术、具备体系化能力的企业方能乘风破浪。中昊芯英作为国内少数专注于TPU架构高性能AI芯片研发的企业,携手天津移动、太极股份、博众数智,基于各自优势明确分工,共同构建了“自主创新+高效集成+智能运营”的闭环体系。此次强强联合不仅是对国家战略的有力响应,也为国产算力产业的可持续发展提供了可复制、可推广的实践范本。

从硅谷到中国,

中昊芯英的创新基因是什么

中昊芯英的诞生,本身就带有强烈的创新基因和一段充满前瞻性的创业历程。最早可以追溯到中昊芯英创始人杨龚轶凡的求学历程,他2005年被保送至上海交通大学电子信息与电气工程学院,期间进入了由张志刚教授创办的电子信息实践中心,2007年到美国密歇根大学继续深造,并在美国先后获得了密歇根大学学士学位、斯坦福大学硕士学位。

毕业后杨龚轶凡又有数年的硅谷工作经历,让他深刻体会了硅谷的创新基因。2011年在Oracle,他参与芯片团队重组和高性能芯片设计,2017年加入谷歌,成为TPU(Tensor Processing Unit,张量处理单元)核心团队成员,深度参与TPU v2、v3、v4的架构和研发,并见证TPU芯片训练出Transformer架构的突破。

彼时,大模型尚未广为人知,Transformer初显强大泛化能力的雏形,预示着未来通向AGI的路径。正是在这一趋势中,杨龚轶凡敏锐洞察到AI芯片需求的持续增长,以及中美科技竞争的加剧,由此坚定了他回国创业、推动国产AI芯片设计与产业化的决心。

2018年杨龚轶凡正式回国并创立了中昊芯英,开始在AI芯片领域最初、最本质的探索,从回国创业的第一行代码、第一套指令集起,他带领团队坚持100%自主研发设计,其指令集完全由团队自主研发,未采购任何国外IP,确保了从底层技术到上层应用的完全自主可控。

中昊芯英创始人、CEO杨龚轶凡接受媒体采访

来源:中央电视台《新闻联播》

经过近五年时间的潜心打磨,中昊芯英于2023年量产了我国首枚全自研GPTPU架构(General-Purpose Tensor Processing Unit,通用目的张量处理单元)高性能AI芯片“刹那®”,实现了在IP核、指令集与计算平台等关键环节的完全自主可控,成为我国首枚实现量产的高性能TPU AI专用芯片。

众所周知,我国芯片产业面临“卡脖子”难题,主要集中在先进制程和高性能芯片设计能力两方面。制程方面,目前全球最先进的芯片已进入3纳米、4纳米阶段,而我国相对成熟的工艺节点仍以7纳米、14纳米为主。尽管在制程工艺上存在差距,但通过架构优化、系统协同等方式,我国在中低制程节点上也在积极探索实现高性能的自主创新路径。

据了解,“刹那 ®”芯片通过Chiplet技术与2.5D封装工艺,在同等制程下实现性能跃升:算力性能超越海外知名GPU产品近1.5倍,能耗降低30%,单位计算成本降低50%,其存算一体设计与流水线式时空映射技术,可高效支撑超大参数AI模型的训练与推理任务,为智算中心奠定核心算力基础。

杨龚轶凡表示,“从我们今天实际测试的结果来说,中昊芯英即使晚于国际巨头一个制程,也能通过架构创新实现相近甚至更强的性能和更低的能耗。”这种“以巧破力”的创新路径,为国产芯片在技术制程受限的背景下,提供了宝贵的弯道超车机会。

除了性能上的突破,中昊芯英也洞察到算力产业绿色节能的趋势。杨龚轶凡表示,TPU架构本身就以其高效节能著称,能耗仅为同性能GPU的1/4到1/3,天然符合绿色低碳的发展要求。

在谈及备受关注的液冷技术时,数据猿记者向杨龚轶凡提出了一个业内普遍关注的问题:当前液冷系统中使用的非导电液体成本高昂,甚至被形容为“比黄金还贵”。在此背景下,液冷方案在能耗控制与整体经济性方面,是否真的具备可持续的优势?

杨龚轶凡回答道,随着新型氟化有机相变液体的应用,液冷系统的降温效率大幅提升,中昊芯英与国内领先液体厂商合作,已将整套液冷方案的构建成本降至与传统风冷机房相当。现在关键挑战转向液体本身的可靠性——是否能稳定支撑6到10年的智算中心运行周期,一旦这一验证完成,液冷将成为未来智算中心主流方案,且不会带来额外成本负担。

在单芯片性能之外,中昊芯英也通过技术创新,致力于构建大规模的AI计算集群。其基于“刹那®”芯片打造的“泰则®”集群,支持1024卡高速互联,可支撑超千亿参数大模型计算,该集群通过1024片芯片的高速片间互联,使用光模块等先进高带宽通信,显著提升了算力与带宽利用效率,实现了集群化效能上的飞跃。

杨龚轶凡解释道,传统交换机的原理建立在用户使用存在时段差异的假设之上,能够通过整合波峰波谷,减少对出口带宽的需求。但在大模型训练中,这一逻辑不再适用——数千乃至上万个芯片需同时启动、并行计算,对网络带宽和架构提出了极高要求。传统集群架构难以支撑如此密集的通信需求,因此中昊芯英在网络架构中创新性实现了二维环(2D Torus),并具备向三维环(3D Torus)等更高维拓扑扩展的能力,有效优化了大规模同步通信的延迟和带宽,重新设计高性能AI算力网络,从而实现更高效的集群并行性能。

从高效能国产AI芯片“刹那®”的自主研发,到绿色节能材料的探索,再到面向未来智算中心的“泰则®”集群网络架构,相较于单点技术突破,杨龚轶凡带领下的中昊芯英更强调体系化布局与对前沿趋势的敏锐判断,正如他在2017年即洞见Transformer将引领AI变革,并迅速投身创业,这种布局思路贯穿于该公司架构设计、研发路径与产品演进的全过程。

大模型应用激增带来成本挑战,

中昊芯英坚定的应对策略

众所周知,人工智能进入大模型时代,整个产业对算力的需求呈现爆发式增长。面对模型规模化、具身智能兴起以及未来产业格局的多重变化,这既为中昊芯英这样的AI芯片新势力带来了前所未有的发展机遇,也带来了巨大的挑战。

从需求端看,大模型的规模正以惊人的速度向万亿参数迈进。杨龚轶凡在采访中指出,去年业内还在说模型参数7B就够了,一块芯片也能运转,但今年所有行业模型全部迭代到70B,甚至没有人再提7B的模型,那明年会不会普遍到700B?这种迭代几乎是一个必然的趋势。

面对这几年应用的发展趋势,中昊芯英认为具身智能、无人驾驶将在未来三到五年内迎来新的落地可能性。杨龚轶凡以特斯拉FSD和斯坦福团队的机器人研究为例,指出大模型的出现使得端到端模型成为可能,进而推动了具身智能的发展。届时,将需要针对单体智能操作的特定算力支撑,而TPU适合深度学习的架构正是为这种场景而生。

杨龚轶凡强调,随着AI应用量的持续增长,芯片的定制化设计在性价比上将远超通用器件,至少高出2−3倍,甚至可以达到5−10倍,这种趋势正是TPU架构的天然优势所在,因为TPU从设计之初就是为特定工作负载(AI计算)而生,其控制逻辑更为简单,能效比更高,更适合进行定制化设计。

“与此同时,算力的需求量越大,成本随之越高,本身70B落地就很难,因为成本很高,那700B落地是不是就更难,成本如果翻10倍了,这个时候怎么办?”杨龚轶凡如是说道,“由于业内想尽一切办法降低计算成本,未来的方式将属于AI芯片,定制化设计的方式会完全替代GPU成为计算生产力的核心,这也是中昊芯英的核心机遇。”

杨龚轶凡表示,要能支撑不断增长的模型运行又能控制成本,芯片设计需从两个维度进行优化:其一是在单芯片层面,通过针对大模型核心算子(例如Attention)的定制优化,实现比传统GPU更高效的向量计算;其二是降低控制逻辑复杂度,提升晶体管利用率。传统GPU像是一座由万人组成的万能工厂,调度成本高、效率低;而TPU等新架构则通过“任务分工”实现更高效的模型运行,它是面向AI未来的硬件演进方向。此外,单芯片做到极致还不够,支持万亿甚至百万亿的模型,还需要构建集群。

杨龚轶凡表示,虽然很多人认为算力价格在不断下降,会做出比较乐观的判断,实际上当前算力的成本依然过高,以AI Agent为例,如果采用671B满血版的大模型,大约需要400万人民币,而且只能同时支持约64个工程师使用。算力是AI大部分应用最大的成本项。

面对这些机遇与挑战,中昊芯英的应对策略是明确而坚定的。杨龚轶凡表示,“以我们今年的第二代芯片产品为例,性价比将实现翻倍,高性价比带来的利润空间和可落地性就会大幅增强,如此大幅降低算力成本,方能解决AI应用落地的‘最后一公里’问题。”

杨龚轶凡特别给出了一个未来产品规划:中昊芯英计划通过下一代芯片产品将大模型部署成本降低50%。成本下降,将极大降低AI应用的门槛,使得更多企业和个人能够用得起、用得上AI算力,从而推动AI技术的广泛普及和产业化落地,形成一个良性的正向循环。

中昊芯英TPU AI芯片——刹那®,来源:中昊芯英

杨龚轶凡在接受数据猿记者采访时还提到,由于TPU架构的边界复杂程度远低于GPU,因此软件栈的开发成本也低很多倍,借助自动编译与高效算子的适配机制,TPU可更快速支持新算法落地,从而释放更多研发资源,提升对硬件架构本身的专注度与产品成熟度。中昊芯英的TPU架构目前已兼容TensorFlow等主流深度学习框架,并成功适配了多款国内主流大模型。

面对算力难题,中昊芯英更选择与天津移动、太极股份合纵连横

仅有开源生态的参与还远远不够,将技术突破转化为可规模化复制的产业实践,离不开上下游的深度协同,中昊芯英正是基于这一判断,积极拓展更广阔的生态合作空间。本次中昊芯英与天津移动、太极股份等企业的合作,不是简单的资源叠加,而是对国产算力发展痛点的一次系统性回应。

在该项目的合作中,中昊芯英扮演着“核心算力引擎”的角色,作为中国TPU架构AI芯片研发的先行者与领导者,中昊芯英基于TPU AI芯片“刹那®” 构建的“泰则®”TPU AI服务器,为项目提供了核心的AI算力效能。

太极股份作为数字基础设施服务的国家队,致力于算力集群的软硬件系统集成建设与运维服务。搭载太极自研的TAIJI2000-Z001 CPU服务器与中昊芯英的“泰则®”TPU AI服务器,集成AI算力服务器系统,同步开发适配国产芯片的嵌入式软件,并提供一次性集成部署及后期运维等全生命周期服务,通过“软硬件+集成+运维”的一体化能力,确保了算力集群的高效稳定运行。

而天津移动作为驻地央企,积极落实天津市政府打造“算力”产业发展新高地战略思路,以 “供给者、汇聚者、运营者” 定位全面推进 “AI+” 行动计划。通过“算力运营平台、MaaS 平台、云管平台”三大关键平台的建设,从“算力提供者”向“智能服务提供者”进行战略转型。构建以异构融合、高速传输、统一调度、服务化供给为核心特征的“四位一体”新型AI算力体系。

中昊芯英与天津移动、太极股份通过“芯片-服务器-运营”的垂直整合模式,构建了一个高效、可控的国产算力核心底座。三方协作构建的天津移动TPU智算中心,不仅实现了国产算力技术的规模化应用,更成为推动华北AI产业升级的核心引擎。该中心可高效支撑Llama、Qwen、Gemma、Baichuan等主流大模型的部署,标志着我国在AI算力领域从 “技术突破” 迈向 “生态落地”。

天津移动TPU智算中心点亮仪式,来源:WAIC

在项目实施过程中,各方的分工与洞察也充分印证了这一模式的战略价值。数据猿记者在采访中提到,当前很多智算中心存在算力闲置、高质量算力稀缺等行业痛点。对此,天津移动城三分公司副总经理高亢和天津移动网运中心算力平台维护支撑室经理柴华回应道,天津移动正致力于从“算力提供者”向“智能服务提供者”转型。他们发现通用大模型在垂直行业的应用价值有限,因此正积极依托高质量算力,为医疗、金融等行业客户量身定制垂类模型,提供全闭环的智算服务,而中昊芯英提供的易用且高性价比的算力资源,正是实现这一愿景的关键。

太极股份数字基础设施业务集团总经理孟凡池则从市场供需角度进行了客观分析。他指出,当前无论是国产还是进口芯片都供不应求,但算力需求却异常旺盛,尤其是互联网大厂都在进行大规模的战略布局。

孟凡池强调,这种“一卡难求”的局面,正是国产算力发展的窗口期。他认为,中昊芯英的TPU技术路线独具特色,对于垂直行业应用量身定做,成本低、性能好,性价比更好,在国产算力市场中拥有独特的竞争优势,而太极股份则凭借其在客户端的行业优势和集成能力,能够将中昊芯英的技术优势转化为具体的行业解决方案。这一合作,正是抓住了市场缺口和技术机遇,共同推进国产算力产业化。

而对于中昊芯英而言,这一合作的成功,不仅是其技术实力在生态伙伴中得到延伸,也充分证明了与合作方的优势互补,能够推动国产算力迈向新阶段。杨龚轶凡表示,“如今三方的结合在芯片、系统、云计算及整个产业链上已形成强联联合,我们希望通过共同努力,助力国家开创人工智能产业化的新纪元。”

浪潮下的缩影,

多维驱动国产算力引擎迈向新阶段

我们认为,今天中昊芯英与两大央企的强强联合,其背后所折射出的,是中国国产算力产业正在经历的一次深刻变革与持续演进,这并非孤立的企业合作,而是国家战略、市场需求与技术创新共同驱动的必然结果,也为我们提供了观察行业未来趋势的窗口。

首先,国产算力产业的发展已超越单点技术攻关,迈向了系统化、生态化的协同发展新阶段。从国家“东数西算”工程、《算力基础设施高质量发展行动计划》等政策导向中可见,国家层面正在推动算力基础设施的集约化与智能化发展。中昊芯英的TPU芯片、太极股份的服务器集成、天津移动的算力运营,三者构成的全链条模式,正是对政策号召的具象化响应。这一实践表明,未来的算力竞争将是生态体系的竞争,只有打通上下游产业链,才能将技术优势转化为真正的产业动能。

这一现象同样呼应了行业的共识:即中国AI芯片产业正呈现出“多芯、多技术路径”的繁荣局面。正如中昊芯英创始人杨龚轶凡所观察到的,未来三到五年内,中国AI芯片产业将呈现出“多芯、多技术路径”的发展模式。他指出,在硅谷已经没有新的GPU创业公司,但在国内却有十几二十家不同版本的AI芯片初创公司,这正是中国产业发展成熟度的体现。

该路径反映出在大模型浪潮下,市场对多元化、定制化算力需求的爆发。中昊芯英的TPU路线,正是这股创新浪潮中的典型代表。它提醒我们,在追赶传统通用芯片的同时,国产算力更应探索差异化路径,在细分领域和特定场景中寻求突破,实现“以巧破力”的弯道超车。

此外,成本与能效正在成为国产算力在市场中脱颖而出的核心竞争力。在当前算力“一卡难求”且价格高企的市场环境下,杨龚轶凡所提出的通过TPU架构实现单位计算成本大幅降低、能耗显著下降的策略,显得尤为关键。这不仅能够解决AI应用落地的“最后一公里”问题,也符合国家对绿色低碳发展的要求。它促使我们思考,国产算力在追赶性能的同时,如何以“极致性价比”和“绿色节能”为突破口,探索差异化竞争的路径,从而在激烈的市场竞争中赢得一席之地。

最终,所有这些趋势都指向一个核心命题:自主可控。面对复杂的国际技术壁垒和供应链不确定性,国产替代已不再是简单的商业选择,而是关乎国家战略安全和产业韧性的必然要求。正如孟凡池在采访中指出,AI核心底座的算力之争,背后就是大国之间的科技国力竞争。而中昊芯英从创业之初就坚持全自研的技术路线,其选择与央企的合作也证明了全面自主可控的可行性与价值。可以说,中昊芯英现象是中国国产算力产业在时代浪潮下的一个缩影,它正通过技术创新和生态协同,为中国在全球AI竞争中扮演更重要的角色,奠定坚实的基础。

来源:数据猿

相关推荐