摘要:我们认为AI推理降本有望带动AI应用的爆发,ASIC作为高性价比的算力方案,有望充分受益推理算力需求增长。从chatgpt3发布以来,大语言模型的推理的成本以指数级别下降,单美元可生成的token数量持续增长,据A16z Infrastructure测算,推理
作者:樊志远
摘要
■ 投资逻辑
我们认为AI推理降本有望带动AI应用的爆发,ASIC作为高性价比的算力方案,有望充分受益推理算力需求增长。从chatgpt3发布以来,大语言模型的推理的成本以指数级别下降,单美元可生成的token数量持续增长,据A16z Infrastructure测算,推理成本每年降低幅度约10倍。模型推理的算法升级落地,通过包括强化学习、MOE等方法提升模型推理能力。我们认为:模型的推理成本快速降低,有望带动应用的爆发,而应用爆发将带动更多的推理算力需求,同时推理算法的迭代也带动更多算力需求。ASIC相比GPU可针对业务场景做定制开发,我们认为大量的推理算力以及降本诉求将有效带动ASIC的需求增长。目前北美云厂商积极布局ASIC,已经实现规模化生产的ASIC包括谷歌的TPU、亚马逊的Trainium与Inferentia、微软的Maia以及Meta的MTIA,其中谷歌和亚马逊的产品在2025年已经开始实现较大规模出货。我们认为其他云厂商ASIC在成熟度逐渐提升后,未来也具备较大的增长空间。Openai等厂商也在积极布局ASIC。从数量来看,TPU是目前ASIC当中最为主要的产品之一。根据Digitimes测算,2023年TPU在ASIC的市占率约71%,2024年全球ASIC出货达到345万颗,其中TPU占比提升至74%。根据Omidia测算,2024年TPU的销售额在60~90亿美元。亚马逊Trainium2已经推出,2024、2025年出货增长迅猛。根据Trendforce,AWS的出货成长力道强劲,24年年增率突破200%。预计2025年AWS出货量将成长70%以上,并更聚焦往Trainium芯片发展,投入AWS公有云基础设施及电商平台等AI应用。Meta ASIC MTIA已经推出第二代,目前主要用于模型推理,Meta预计26年将有用于训练的ASIC推出。除了北美四大CSP以外,我们预计未来领先的模型厂商如openai等也将开发ASIC。根据《经济日报》,openai预计将采用台积电3nm以及A16制程生产ASIC,预计openai的ASIC将在26年年底进入量产。
我们看好ASIC设计服务公司、以太网白盒交换机厂商与以太网交换芯片厂商、AEC厂商、PCB厂商。1)ASIC设计服务公司:目前除美系厂商外,世芯、创意电子已拿到北美云厂商ASIC项目,联发科也有望在ASIC获得一定份额。我们认为,ASIC在推理算力占比提升的大背景下,需求增长的趋势明确,但需要关注行业竞争格局的变化,需要密切关注每个芯片项目的获得者。建议关注导入北美云厂商的ASIC设计服务公司。在美国制裁加剧情况下,我们认为国内云厂商ASIC项目有望采用国内设计服务企业,国内相关企业有望受益。2)以太网白盒交换机厂商与以太网交换芯片厂商:由于ASIC采用以太网组网,我们认为ASIC的放量有望带动以太网在AI组网的渗透率提升以及需求。白盒以太网交换机方案趋势明确,主要厂商Arista在10G及以上的数据中心交换机市场的出货量以及营收市占率都已经超过思科。未来来看,我们认为云厂商采用自研系统采购白牌交换机的比例有望逐渐扩大。建议关注:Arista以及白牌交换机厂商。以太网交换芯片是以太网交换机的核心部件,建议关注商用以太网交换芯片厂商。3)AEC厂商:以太网白盒交换机厂商与以太网交换芯片厂商,我们认为Credo具有一定先发优势,看好Credo,建议关注其他在AEC布局的厂商。4)PCB厂商:我们认为ASIC兴起将带动产业链显著升级,AI对算力PCB提出更高需求,同时数据量增长带动基础设施升级。另外ASIC芯片采用多die形式,显著提升对载板的需求。建议关注在高速通信领域具备较强高多层板与HDI板的厂商,以及具备封装基板能力的厂商。
投资建议
目前北美CSP已经积极布局ASIC,另外模型厂商如Openai也在积极布局ASIC。ASIC有望迎来高速增长。我们看好ASIC设计服务公司、以太网白盒交换机厂商与以太网交换芯片厂商、AEC厂商、PCB厂商。
目录
一、AI 应用有望带动推理算力需求,云厂商持续加码ASIC
1. 推理降本趋势明显,ASIC方案性价比凸显
2. 谷歌、亚马逊加码ASIC,其他CSP有望跟进
二、看好ASIC设计服务公司、以太网、AEC、PCB相关厂商
1. ASIC设计服务公司业绩进入放量期,关注ASIC项目design wins变化
2. ASIC采用以太网组网,以太网交换芯片、白盒交换机厂商有望受益
3. ASIC带动AEC需求加速,云厂商开始导入ASIC
4. PCB:ASIC的单位PCB耗用量更高,多die合封带来封装基板市场需求扩容
三、投资建议
四、风险提示
正文
一、AI 应用有望带动推理算力需求,云厂商持续加码 ASIC
1.1 推理降本趋势明显,ASIC 方案性价比凸显
从chatgpt3发布以来,大语言模型的推理的成本以指数级别下降,单美元可以生成的token数量持续增长。同时模型的能力也持续增加。相较于最早的chat gpt3,目前的主流模型都可以通过更低的推理成本达到更高的智能水平。在2021年1月,GPT3是唯一可以达到MMLU 42分的大语言模型,当时百万token的成本在60美元,截至2024年11月,由together.ai提供的Llama 3.2B可以同样达到MMLU 42分的水平,但百万token的成本以及降低到0.06美元。而可以达到MMLU 83分的大语言模型中,Llama 3.1 70B截至2024年11月百万token的成本已经小于1美元。根据A16z Infrastructure测算,推理成本每年降低幅度约10倍。
图表1:大模型推理成本按照指数下降,每年降低幅度约 10 倍
来源:A16z Infrastructure,国金证券研究所
另外我们注意到,目前模型的能力提升,除了模型的预训练以外,推理的算法升级也不断落地,通过包括强化学习、MOE等方法提升模型推理能力。我们认为:模型的推理成本快速降低,有望带动应用的爆发,而应用爆发将带动更多的推理算力需求,同时推理算法的迭代也带动更多算力需求。我们认为大量的推理算力以及降本诉求将有效带动ASIC的需求增长。
图表2:Deepseek 依靠推理端算法优化可以实现较好智能程度(单位:%)
来源:《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》,国金证券研究所
ASIC相比GPU,主要优势在于性价比。ASIC采用定制化设计,可以针对云厂商的业务,以及模型做定制开发,将其中常用的算子直接固化到硬件当中,可以大幅提升运算效率,同时降低功耗。另外GPU主流厂商如英伟达产品具有较高毛利率,采用ASIC在单价上也有望降低。
图表3:ASIC 相比 GPU 牺牲灵活性,但提高效率
来源:Bitdeer 网站,国金证券研究所
1.2 谷歌、亚马逊加码 ASIC,其他 CSP 有望跟进
目前北美云厂商积极布局ASIC,已经实现规模化生产的ASIC包括谷歌的TPU、亚马逊的Trainium与Inferentia、微软的Maia以及Meta的MTIA,其中谷歌和亚马逊的产品在2025年已经开始实现较大规模出货。我们认为其他云厂商ASIC在成熟度逐渐提升后,未来也具备较大的增长空间。另外Openai等厂商也在积极布局ASIC,未来有望进入量产。
谷歌TPU在24年已经推出第六代产品当中用于推理的v6e产品,与 TPU v5e 相比,Trillium TPU 每一芯片峰值计算效能提升了 4.7 倍,为相当惊人的表现。TPU V6e将HBM的容量与带宽提升 1 倍,芯片间互连网络带宽也提高了一倍。此外,v6e还配备了第三代 SparseCore,这是处理超大嵌体的专用加速器,常用于处理进阶排名与推荐工作负载。V6e可以更快速地训练下一代基础模型,并以较短的延迟时间与较低成本提供模型服务。与TPU v5e相比,TPU V6E的能源效率高出 67%。
从数量来看,TPU是目前ASIC当中最为主要的产品之一。根据Digitimes测算,2023年TPU在ASIC的市占率约71%,2024年全球ASIC出货达到345万颗,其中TPU占比提升至74%。根据Omidia测算,2024年TPU的销售额在60~90亿美元。
图表4:v6e 在算力上有明显提升
来源:谷歌网站,国金证券研究所
图表5:24 年全球 ASIC 出货 345 万颗,谷歌市占率 74%
来源:Digitimes,国金证券研究所
亚马逊Trainium2已经推出,2024、2025年出货增长迅猛。根据Trendforce,AWS的出货成长力道强劲,24年年增率突破200%。预计2025年AWS出货量将成长70%以上,并更聚焦往Trainium芯片发展,投入AWS公有云基础设施及电商平台等AI应用。
AWS Trainium2 芯片的效能比第一代 Trainium 提升高达 4 倍。以 Trainium2 为基础的 Amazon EC2 Trn2 实例专为生成式 AI 而建置,是用于训练和部署具有数千亿到数万亿以上参数的模型的最强大 EC2 实例。Trn2 实例的价格效能比目前一代 GPU 型 EC2 P5e 和 P5en 实例更好 30-40%。Trn2 实例配备 16 个 Trainium2 芯片,这些芯片透过 NeuronLink 实现互连。Trn2 UltraServer 是全新的 EC2 产品,非常适合需要比独立 EC2 实例所能提供更多内存和内存带宽的最大型模型。UltraServer 设计使用 NeuronLink 将四个 Trn2 实例中的 64 个 Trainium2 芯片联机至一个节点中。对于推理而言,UltraServer 可协助提供业界领先的响应时间,进而创造出最佳的实时体验。对于训练而言,与独立实例相比,UltraServers 会透过更快的协同通讯来提高模型平行性的模型训练速度和效率。
目前包括Adobe、AI新创公司Poolside、数据平台服务Databricks以及高通都通过Trainium2处理器训练其AI模型,其中,高通在云端计算AI模型后再将其传送至边缘端。另外苹果也在采用亚马逊ASIC芯片提供的服务,应用于Siri,Apple Maps和Apple Music。苹果使用亚马逊的Inferentia和Graviton芯片来服务搜索服务。
图表6:亚马逊 Trainium2 包括 Trainium2 与 Trainium2 Ultra 两个版本
来源:Semianalysis,国金证券研究所
Meta ASIC MTIA已经推出第二代,目前主要用于模型推理,Meta预计26年将有用于训练的ASIC推出。MTIA 使用台积电 5nm 工艺制造,具有 90W 的热设计功耗(TDP),显著降低了功耗需求,使其在数据中心中更易于管理。同时,该处理器采用 16 通道 LPDDR5 内存,配备 128GB 的内存配置,为高效数据处理提供了强有力的支撑。根据Meta 24Q4业绩会,目前MTIA主要用于模型推理以及推荐类任务,预计26年MTIA将用于训练当中。
微软也已经推出MAIA 100 ASIC,采用5nm制程,64GB HBM2E。考虑微软Azure云具有较大体量,同时微软具备Copilot等终端AI应用场景,我们预计未来微软ASIC也将发力。
图表7:Meta、微软已经分别推出 ASIC MTIA、Maia
来源:Meta 网站、hotchips 网站,微软,国金证券研究所
除了北美四大CSP以外,我们预计未来领先的模型厂商如openai、deepseek等也将开发ASIC。根据《经济日报》,openai预计将采用台积电3nm以及A16制程生产ASIC,目前已经向台积电预定A16产能,预计openai的ASIC将在26年年底进入量产。OpenAI、甲骨文和软银合作建立星际之门项目,预计投资5000亿美元用于人工智能基础设施建设,考虑星际之门项目的高投资,我们预计openai的ASIC未来也将有较大规模出货量。
二、看好 ASIC 设计服务公司、以太网、AEC、PCB 相关厂商
2.1 ASIC 设计服务公司业绩进入放量期,关注 ASIC 项目 design wins 变化
目前云厂商所采用的设计服务公司主要包括美系厂商博通、Marvell,以及台系厂商世芯、创意电子,未来来看联发科也有望在ASIC获得一定份额。在美国制裁加剧情况下,我们认为未来国内云厂商有望更多采用本土设计企业进行ASIC设计。
设计服务公司主要承担芯片的前道设计、后道封装设计,并且对ASIC进行量产。设计服务公司的主要壁垒主要在关键IP(如HBM PHY的IP、高速Serdes IP等)以及先进封装的经验。
图表8:定制 ASIC 业务的技术关键在于关键 IP 与先进封装技术
来源:Marvell 网站,国金证券研究所
博通是目前最主要ASIC设计服务公司,已经获得五个客户,25年预计有三个客户的ASIC都将量产。FY24博通AI收入为122亿美元,同比增长220%,达到博通半导体收入占比的41%。根据博通24年3月的投资者交流会议,博通已经获得三个ASIC客户,根据博通24年12月业绩会,博通ASIC获得了额外两个客户,并且预计27年AI的SAM将达到600~900亿美元。
图表9:博通 25 年将实现三家 ASIC 客户产品量产
来源:博通网站,国金证券研究所
图表10:博通 AI 收入占半导体收入比例快速提升
来源:博通网站,国金证券研究所
Marvell是美国重要的ASIC设计服务厂商之一,目前已经获得两个客户的AI ASIC项目,另外获得了一家客户的arm CPU的项目。公司指引FY25、FY26 AI收入分别为15、25亿美元,其中定制化芯片营收分别为5、10亿美元,主要来自定制化AI芯片。根据Marvell测算,2023年Marvell在数据中心市场的TAM为210亿美元,其中定制化芯片市场为66亿美元,预计2028年Marvell在数据中心的TAM为750亿美元,其中定制化芯片市场为429亿美元,23~28年定制化芯片的CAGR为45%。
图表11:Marvell 已经获得三家客户的 ASIC 项目
来源:Marvell 网站,国金证券研究所
图表12:Marvell 预计 28 年定制化芯片 TAM 达到 429 亿美元(单位 :十亿美元)
来源:Marvell 网站,国金证券研究所
台系ASIC设计服务公司主要包括世芯、创意电子以及联发科,世芯有望获得亚马逊ASIC项目,联发科有望获得谷歌ASIC项目。根据《经济日报》,亚马逊AWS于12月3日发表新一代AI自研芯片Trainium3,将于2025年底上市,其中项目设计服务由世芯负责,并采用3nm制程。世芯23、24年业绩大增,24年收入合计为520.39亿新台币,同比+70.53%。主要受惠亚马逊7nm制程AI芯片项目,目前亚马逊AWS对其业绩营收贡献度超过一半,是举足轻重的大客户。不过因第4季7nm制程AI芯片进入出货尾声,导致世芯营收较第3季下滑。
图表13:世芯营收高速增长,24 年同比+70.5%
来源:世芯网站,国金证券研究所
图表14:世芯 7nm 及更先进制程项目收入占比超 90%
来源:世芯网站,国金证券研究所
联发科积极布局ASIC,未来有望进入谷歌。根据《中时新闻网》,联发科与Google推理TPUv7 SerDes的新案,预期将带动2025至2026年的营运成长。联发科在ASIC领域已经具备一定技术积累,包括224G SERDES、PCIe 5.0/6.0/7.0、800G/1.6T Retimer、HBM解决方案、CoWoS-S/CoWoS-L先进封装能力。
图表15:联发科在 Computex 2024 上展示的 ASIC 设计方案
来源:Computex 网站,国金证券研究所
创意电子在HBM PHY芯片具有较多设计项目,另外在AI ASIC与微软合作。创意电子HBM3E IP方案在技术上领先市场,并已通过台积电先进制程技术的硅验证,包括N7/N6、N5/N4P、N3E/N3P制程。此外,创意电子的IP亦通过所有主流HBM3供应商的硅验证,确保其解决方案的兼容性与稳定性,并且积极与HBM记忆体供应商如美光科技合作,致力于开发下一代HBM4 IP,以应对未来更多元化的应用需求。在AI ASIC项目当中,公司主要与微软合作,目前主要产品包括AI ASIC MAIA 100以及arm CPU Cobalt。根据《中时新闻》,今年出货仍以第一代为主,Maia2要等到2026年首季才放量,CPU部分将持续出货原先的Cobalt 100,预计25年第四季结束出货。
图表16:创意电子 24 年实现营收 250.44 亿新台币,同比-4.6%
来源:创意电子网站,国金证券研究所
我们认为,ASIC在推理算力占比提升的大背景下,需求增长的趋势明确,但需要关注行业竞争格局的变化。目前北美云厂商在ASIC领域都开始逐步引入多家设计服务公司,需要密切关注每个芯片项目的获得者。考虑联发科在谷歌进展较缓慢,需要tpu v7才有望实现产品导入,以及博通在meta XPU目前仍然为唯一供应商,我们认为博通在ASIC设计服务公司当中最为受益。而世芯在亚马逊有望重新拿到ASIC订单,考虑亚马逊的较大ASIC需求,26年也有望具备较大增长动能。对于ASIC设计服务公司,我们建议关注:博通、世芯、联发科、创意电子、Marvell。
图表17:北美 CSP 引入多家 ASIC 供应商
来源:中时新闻,国金证券研究所
我们认为A股公司当中翱捷科技、芯原股份有望受益国内ASIC趋势。翱捷科技能够按照客户需求提供芯片架构定义、芯片设计、封装测试、芯片量产、配套软件开发等各环节的部分或全部服务。可满足客户高端系列产品对开发更高性能产品的需求,以及对供应链安全方面的本地化需求。翱捷科技24H1实现芯片定制业务收入2.26亿元,较23H1的1.18亿元接近翻倍,客户群体包括人工智能算法企业、互联网企业、大数据企业等。
芯原股份可以为客户提供从芯片定义到设计流片的全流程设计服务 (含软件设计服务),还提供经过验证的平台化芯片解决方案以帮助客户快速完成芯片设计。此外,芯原还可帮助客户委外完成晶圆制造、封装和测试等,并提供优质的生产管理服务。目前芯原股份可以芯片设计公司和IDM、系统厂商、大型互联网公司、云服务提供商在内的各种客户提供高效经济的半导体产品替代解决方案,其终端应用可覆盖消费电子、汽车电子、计算机及周边、工业、数据处理和物联网等广泛的行业应用市场。
三、投资建议
我们认为Deepseek等低成本高能力的开源模型的出现,有望带动AI应用爆发,带动推理算力的需求高速增长。ASIC作为具备较高性价比的产品,有望在推理端得到广泛应用。目前北美CSP已经积极布局ASIC,谷歌TPU、亚马逊Trainium已经有较大规模出货,另外模型厂商如Openai也在积极布局ASIC。ASIC有望迎来高速增长。
我们看好ASIC设计服务公司、以太网白盒交换机厂商与以太网交换芯片厂商、AEC厂商、PCB厂商。
在ASIC设计服务领域,主要参与厂商包括博通、Marvell、世芯、联发科、创意电子等,目前北美云厂商ASIC开始逐步引入多个供应商,需要密切跟踪竞争格局的变化,建议关注:博通、世芯、联发科、翱捷科技、芯原股份、创意电子、Marvell。
在以太网交换机与以太网交换芯片领域,我们认为由于ASIC采用以太网组网,ASIC的放量有望带动以太网在AI组网的渗透率和需求提升,我们看好白盒交换机厂商与以太网交换芯片厂商,建议关注:Arista、博通、天弘科技、智邦、Marvell。
我们认为ASIC有望带动AEC需求,目前北美CSP已经开始采用AEC,我们认为Credo在AEC市场具备一定先发优势,我们看好:Credo、立讯精密,建议关注:Astera Lab、Marvell、瑞可达、博创科技。
我们认为ASIC兴起将带动PCB市场空间提升,主要体现在高速通信领域所用高多层高速板和HDI板,同时多die合封有望增加封装基板市场需求,建议关注:沪电股份、生益科技、联瑞新材、兴森科技等。
四、风险提示
AI进展不及预期:如果AI进展不及预期,可能导致模型的应用需求不及预期、使用客户数量不及预期,影响ASIC的需求,导致相关公司业绩不及预期。
行业竞争加剧:AI行业趋势明显,布局AI的厂商数量持续增多,将导致行业竞争加剧,影响相关公司业绩。
下游需求不及预期:ASIC终端客户为云厂商,如果云厂商资本开支收缩、需求不及预期,将造成相关公司出货不及预期,导致相关公司业绩不及预期。
《AI应用带动推理算力需求,看好ASIC行业厂商发展》
+
报告信息
证券研究报告:《AI应用带动推理算力需求,看好ASIC行业厂商发展》
对外发布时间:2025年03月12日
报告发布机构:国金证券股份有限公司
证券分析师:樊志远
邮箱:fanzhiyuan@gjzq.com.cn
来源:国金证券研究所