摘要:DeepSeek的横空出世引发了AI产业的深刻讨论。本文就DeepSeek对算力需求、芯片市场、技术创新、端侧智能、出口管制、投资逻辑、软件生态、开源生态以及中国科技资产估值等十个关键问题进行了深入分析。
DeepSeek的横空出世引发了AI产业的深刻讨论。本文就DeepSeek对算力需求、芯片市场、技术创新、端侧智能、出口管制、投资逻辑、软件生态、开源生态以及中国科技资产估值等十个关键问题进行了深入分析。
核心观点
1.DeepSeek是否会抑制算力增长?短期抑制VS长期爆发
我们认为DeepSeek本质是对现有AI算法的效率优化,短期可能导致训练需求下降,但随着模型普及和应用场景扩展,长期推理需求将显著增长,这种趋势类似于"蒸汽机降低煤耗但提升煤炭总用量"的历史现象。
2.DeepSeek是否会改变AI算力的增长范式:目前不会
AI算力大致分为1)用于研发前沿模型相关的探索性算力(AGI方向),2)面向消费者的应用性算力(现有模型推理)。目前北美四大AI公司主要通过扩大GPU集群规模的方式探索下一代大模型。只要这个探索工作还在继续产生正向回报,AI算力的增长范式短期或不会发生变化。
3. DeepSeek会改变市场投资逻辑吗?软件有望跑赢硬件
我们认识到,1)未来大模型竞争中,"算法效率"的重要性或上升, 投资重点可能从"算力军备"转向"算法效率"。2)开源协议使中小开发者能基于前沿模型二次开发,创造更多创新机会。投资角度,看好美股软件表现好于硬件。
4.芯片市场格局是否会改变?高端GPU用途受限,ASIC占比或提升
DeepSeek的成功显示即使不使用最先进的GPU,也可以开发满足一般消费者需求的大模型。这可能意味着,英伟达的Blackwell/Rubin等最先进的GPU的用途,可能会局限在探索下一代超大规模模型(Frontier Model)上。
5.DeepSeek真的那么便宜吗?可能没有
DeepSeek在其V3技术报告中估计其训练成本只有557.6万美元,根据SemiAnalysis分析,这只包含预训练阶段的部分成本,而加上GPU算力投资,研发、数据收集等其他重要成本或远大于这个数字。
6.DeepSeek到底有哪些创新?混合专家MoE,强化学习,蒸馏等
主要创新包括模型架构(混合专家MoE,MLA)、训练方法(纯强化学习)、蒸馏优化和推理效率提升等,显著提升了AI算法效率和性能。
7.DeepSeek会带动中国科技资产价值重估吗?有可能
目前(2025/2/3),恒生科技指数12月前向PE 20.0倍,远低于纳斯达克的35.4倍。DeepSeek的成功可能提高中国AI公司估值预期。
8.DeepSeek会推动端侧智能发展吗?有可能,但需要时间
DeepSeek的高性价比模型有利于模型在智能手机和汽车等智能设备上落地,我们认为智能硬件迭代不会一蹴而就,模型能力提升只是其中一环。
9.DeepSeek会导致美国提升出口管制压力吗?可能会
我们注意到DeepSeek发布后,美国媒体进一步限制中国发展AI声音抬头。建议关注后续:1)高端AI芯片出口管制,2)前沿模型的开源限制,3)模型回传限制,4)数据获取限制等风险。
10.DeepSeek会改变开源软件生态吗?会
目前基础大模型的开发,主要集中在OpenAI、Google、Anthropic、阿里,字节、百度的科技巨头手中。DeepSeek这次的成功丰富了AI开源生态,也为中小开发者依托开源生态实现快速发展提供了一条发展路径。
风险提示:中美贸易摩擦升级风险,宏观下行风险,创新品渗透不及预期风险。本研报中涉及到未上市公司或未覆盖个股内容,均系对其客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖。
正文
DeepSeek十问十答
问题#1:DeepSeek是否会抑制算力增长?
据DeepSeek V3技术报告,V3模型的训练总计只需要278.8万 GPU小时,相当于在2048卡的H800GPU集群上训练约2个月,合计成本约557.6万美金,相较而言,Llama 3系列模型的计算预算则多达 3930万 H100 GPU小时,DeepSeek训练成本约相当于Llama 3系列模型的7%。
我们认为,DeepSeek对算力需求的影响呈现出短期抑制、长期增长的复杂趋势。短期内,DeepSeek的低成本高效训练方法可能导致训练需求下降。然而,从长远来看,随着模型的普及和应用场景的扩展,推理需求将显著增长。这种趋势类似于"蒸汽机降低煤耗但提升煤炭总用量"的历史现象。
随着AI技术成本的下降,其应用范围将大幅扩展,最终可能导致算力需求的大幅增长。微软CEO纳德拉认为AI效率提升将激发指数级需求。
问题#2:DeepSeek是否会改变AI算力的增长范式
AI算力大致分为1)用于研发通向通用人工智能(AGI)的前沿模型相关的探索性算力(AGI方向),2)面向一般消费者的应用性算力(现有模型推理)。过去两年,推动算力增长的主要动力是,探索性算力增速(25x/2年)远高于摩尔定律(2倍/年),导致GPU需求激增。只要这个探索工作还在继续产生正向回报, AI算力的增长范式短期或不会发生变化。
在通用人工智能(AGI)愿景的驱动下,我们看到,主要科技巨头仍然在加大投入,例如:
1)1/24, Meta宣布计划2025年资本支出达600-650亿美元,主要用于AI基础设施(训练集群和数据中心建设)。
2)1/21,OpenAI宣布和软银、Oracle启动的“Project Stargate”计划投资超1000亿美元建设AI基础设施,显示资本仍集中流向需要海量算力的前沿探索。
根据Factset一致预期,微软、谷歌、亚马逊、Meta、苹果等北美五大科技公司合计资本开支2025年有望继续增长19.6%。其中很大部分投入是用在包括GPT-5、Llama4等在内下一代模型的算力投资。另一方面,Agent等应用目前仍处于探索的初期阶段,大规模商用的时间点仍存在不确定性,所以我们认为目前AI算力的增长范式没有变化。
问题#3:DeepSeek会改变市场投资逻辑吗?
DeepSeek这次的“惊喜”让我们认识到,
1) 未来大模型公司之间的竞争中,"算法效率"的重要性可能上升, 投资重点可能从"算力军备"转向"算法效率"。AI竞赛正从"算力军备"转向"算法效率"。未来的竞争重点或将更多地集中在算法优化和生态活力上。
2) 开源协议能使中小开发者基于前沿模型二次开发,推动大模型创新从少数科技巨头向分布式社区转移,为中小软件企业创造更多创新机会。从投资角度,我们认为2025年是AI发展进入商业化落地的一年。以Agent AI为代表的企业软件有望迅速落地,提升企业工作效率,带动美股软件板块表现或好于硬件。
问题#4:DeepSeek是否会改变芯片市场格局?
根据Jon Peddie Research,3Q24英伟达在全球GPU市场份额达到90%。其中,H100等高端GPU是主要产品之一。DeepSeek的成果显示,在面向一般消费者的大模型市场,企业可以通过使用A100、H800等相对低端的芯片实现类似性能。这可能会影响英伟达2025年以后,B200等最先进GPU在云计算、主权AI等领域的普及。Blackwell/Rubin等最先进的GPU的用途,初期可能会被局限在探索下一代超大规模模型(Frontier Model)上。
问题#5:DeepSeek真的那么便宜吗?
但是,SemiAnalysis在报告中指出,557.6万美金这个数字主要指的是模型预训练的GPU成本,并不包括研发、数据收集、清理等其他重要成本。实际上,DeepSeek的总体投资规模相当可观。据SemiAnalysis估计,其GPU投资就超过5亿美元。考虑到服务器资本支出、运营成本等因素,DeepSeek的总拥有成本(TCO)在4年内可能达到25.73亿美元。DeepSeek的成本优势主要体现在其高效的训练方法和创新的模型架构上。例如,其推理成本降至OpenAI的1/50,这在实际应用中可以带来显著的成本节约。然而,这种成本优势并不意味着整体AI开发和运营成本的大幅降低。
问题#6:DeepSeek到底有哪些创新?
DeepSeek在多个方面展现出技术创新,主要包括模型架构创新、训练方法突破、蒸馏优化、推理效率提升等。其中,混合专家(MoE)架构和多头潜在注意力(MLA)的引入显著提升了模型性能和效率。R1-zero模型采用纯强化学习(RL)训练,跳过监督微调,验证了RL在AI训练中的优先级和有效性。这些创新使DeepSeek在性能、效率和成本方面都取得了显著进展,为AI技术的发展提供了新的方向。特别是在解决复杂数学、物理和推理问题时,其速度是ChatGPT的两倍,且在编程问题上提供了迅速而全面的答案。
1)采用混合专家(MoE)架构,动态调用子模型降低计算量;
2)引入多头潜在注意力(MLA)压缩内存,支持长文本处理;
3)强化学习(RL):R1-zero模型跳过监督微调,通过纯RL直接训练,验证了RL的优先级和有效性;
4)蒸馏优化:利用R1生成数据微调小模型,提升特定场景性能(如数学、代码任务)
模型架构创新、训练方法突破、蒸馏优化、推理效率提升等。
问题#7:DeepSeek会带动中国科技资产价值重估吗?
目前(2025/2/3),恒生科技指数12月前向PE 20.0倍,远低于纳斯达克的35.4倍。DeepSeek的成功可能提高投资者对中国AI公司产业链的估值预期,吸引更多资本投资中国AI领域。
问题#8:DeepSeek会推动端侧智能发展吗?
DeepSeek很可能会显著推动端侧智能的发展,其高性价比模型使得更多企业可能考虑在端侧设备上部署AI应用,推动智能设备的智能化进程。微软推出的专为NPU设计的DeepSeek-R1模型,支持Copilot+PC等设备,实现半连续运行的主动智能体验,为智能手机、汽车等端侧设备提供了高效本地化部署方案。DeepSeek的技术进步可能加速端侧智能的普及和发展,推动AI技术向更广泛的终端设备渗透,从而改变现有的计算范式和用户交互方式。这不仅提升了端侧AI性能,还有助于保护用户隐私,降低了AI应用部署的技术门槛。
但是,从Apple Intelligence过去一年的发展历程中,我们看到,智能硬件的迭代是循序渐进过程,不会一蹴而就。模型能力提升只是其中一环,还存在生态链协调等很多挑战,对2025年AI手机等端侧智能的发展不应抱过高预期。
问题#9:DeepSeek会导致美国提升出口管制压力吗?
DeepSeek发布后,美国媒体进一步限制中国发展AI声音抬头。我们看到以下几个风险:
1) 芯片出口管制收紧:美国可能会加强对高端AI芯片的出口管制;
2)开源限制:美国政府可能会限制科技公司开源大模型,以防止技术扩散;
3)模型回传限制:在2024年年底发布的出口管制政策中,美国政府已经限制在新加坡等第三国训练好的模型回传中国,阻止技术转移;
4)数据获取限制:美国可能会限制用于AI训练的大规模数据集的获取;
5)算力资源限制:除了芯片管制,还可能限制美国云服务提供商的高性能计算资源的使用。
问题#10:DeepSeek会改变开源软件生态吗?
全球主要大模型公司中,OpenAI、Google、Anthropic、字节、百度等采用闭源模式,Meta、阿里等采用开源模式。如下图所示,闭源模型一直保持对开源模型的性能优势。
这次DeepSeek通过开源接近最先进的闭源的高性能模型,可能降低AI技术的使用门槛。开源模式带来边际成本持续下降的技术红利,为AI技术的真正普及奠定了基础。此外,DeepSeek的做法也可能推动其它AI公司重新思考其商业模式。
风险提示
1)中美贸易摩擦升级,影响产品供需与公司海外布局风险;
2)宏观经济下行风险;
3)创新品渗透不及预期,导致公司增长不及预期。
4)本研报中涉及到未上市公司或未覆盖个股内容,均系对其客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖
相关研报
研报:《DeepSeek 十问十答》2025年2月4日
本文源自券商研报精选
来源:金融界