黑马DeepSeek再次搅动AI江湖！投资机会在哪里？

摘要：目前普遍认为DeepSeek的R1 发布标志着推理模型研究的重要转折点，而在此之前推理模型一直是工业研究的重要领域，但缺乏一篇开创性的论文，就像 AlphaGo 使用强化学习下了无数盘围棋并优化其策略以获胜一样，DeepSeek 正在使用相同的方法来提升其能力

一个多月后，更炸街的DeepSeek-R1来了。

1月20日DeepSeek-R1 正式发布，R1-zero 采用的训练策略证明了仅通过强化学习，无需监督式微调，大模型也可以有强大的推理能力。

海外核心高管和AI从业人员的出圈消息(微软CE0和Scale AICEO对DS的评论、Meta员工的 Panic mode)引发市场重视。

目前普遍认为DeepSeek的R1 发布标志着推理模型研究的重要转折点，而在此之前推理模型一直是工业研究的重要领域，但缺乏一篇开创性的论文，就像 AlphaGo 使用强化学习下了无数盘围棋并优化其策略以获胜一样，DeepSeek 正在使用相同的方法来提升其能力，因此2025 年可能会成为强化学习的元年。

更关键的是DeepSeek 通过创新性的方法，在有限的计算资源下实现了这些突破。

性能评估结果显示，通过纯强化学习方法训练得到的 DeepSeek-R1-Zero 以及在此基础上改进的 DeepSeek-R1，在 2024 年AIME(美国数学邀请赛)测试中分别取得了 71.0% 和 79.8% 的成绩，与 OpenAI o1 的79.2% 水平相当。在 API 定价方面，DeepSeek 展现出极强的性价比优势。其 API 服务对输入 token 收取 0.55 美元/百万，输出 token 收取 2.19 美元/百万，而 OpenAI o1 的收费分别为 15 美元/百万和 60 美元/百万，价格差距接近 30 倍。

Deepseek R1 大战 GPT-01:测评视角

1、测试背景与目的

测试背景:为比较Deepseek R1与GPT-01的能力，采用多种学科的竞赛题进行测评。选择数学题作为主要测试方向，是因为数学具有标准化特点，对难度区分度更明确，能有效衡量模型的逻辑能力。同时，也会测试物理、化学等学科题目，以评估模型在跨学科方面的表现。测试目的:通过对不同类型题目(纯文字数学题、图形几何题、跨学科题目等)的测试，全面了解Deepseek R1与GPT-01在逻辑能力、推理速度、思维链展示以及跨学科知识堂握等方面的优势与不足，为评估两个模型的性能提供依据。

2、模型测试过程与结果

纯文字数学题测试:选择高中竞赛难度的纯文字数学题进行测试，如设有理数R属于0到1，R =P/Q(P、Q为互素的正整数，且PQ整除3600)，求这样的有理数R的个数。结果显示，GPT-01和Deepseek R1都给出了正确答案112。在测试的七道题中，Deepseek R1的速度比GPT-01快了约-道题的时间。

图形几何题测试:以带图形的几何竞赛题测试，如正方体中内切圆相关的题目，答案为最小值三倍根号2减3，最大值是三倍根号6。GPT-01只答对了最小值，最大值答错;而Deepseek R1给出了错误答案。但在整体图形几何题测试中，DeepseekR1的速度比GPT-01快，目Deepseek R1全程显示思维链，GPT-4则是在推理结束后才展示精简过的思维链。

3、跨学科题目测试情况

物理题测试:选取物理竞赛题，要求计算恢复系数，正确答案是根号下(根号下H零分G加1M1分之M1加M2减1)。将题目由Deepseek翻译为英文后发给GPT-01，GPT-01给出错误答案。这表明在物理学科的竞赛题上，GPT-01表现不佳。

化学题测试:测试的化学题有带图片且包含多个小问。其中一题两个小问GPT-01都答错，答案分别应为208以及24.3纳米;而Deepseek给出了正确答案。另一道三个小问的化学题，Deepseek和GPT-01都做对了。这显示在化学学科测试中，Deepseek的表现优于GPT-01。4、模型对比与总结

·模型能力对比:从绝对逻辑能力来看，纯文字数学题方面，DeepseekR1与GPT-01水平相当;图形模态上，Deepseek R1强于GPT-01;跨学科题目中，两者较为接近，Deepseek R1有时答对的题目更多。不过，目前尚未完全对比GPT-01与Pro版的差异。模型发展总结:大模型发展至今，0penAI的领先优势在逐渐缩小，国内大模型如Deepseek的追赶速度较快。Deepseek官网流量增长迅速，从12月26日的44万涨至1月21日的420万，增长了约十倍，且外国用户占比较高，中国占比27.9%，位列第二第三的分别是埃及和俄罗斯，美国占比5%。这表明Deepseek在用户增长和国际影响力方面取得了一定成绩。

中国AI公司和开源模型的全面崛起:

随着 DeepSeek，Minimax等中国公司在 AI 领域的崛起，全球 AI 竟争格局正在发生微妙变化。如果中国公司能够以更低的成本实现同等或更好的性能开源大模型，海外开源和闭源模型或都受到挑战，此外应用端在字节豆包带动下持续对商业化场景展开探索，国内AI公司和开源模型或将持续推动大模型产业和相关AI应用的升级，

DeepSeek相关主要包括以下几类

股权关联方

浙江东方:通过旗下杭州东方嘉富基金参投Deepseek天使轮。华金资本:珠海国资旗下投资平台间接参与DeepSeekPre-A轮融资

算力基础设施供应商

浪潮信息:为Deepseek北京亦庄智算中心提供AI服务器集群及英伟达H800+自研AIStation管理平台。中科曙光:承建DeepSeek杭州训练中心液冷系统。润泽科技:廊坊数据中心为Deepseek提供3000+机柜资源

垂直领域合作方

拓尔思:与Deepseek联合开发金融奥情大模型，已在中信证券等机构部署智能研报生成系统，科大讯飞:在教育领域接入了DeepSeek-Math模型，并联合推出了AI数学辅导应用“星火助学”金山办公:WPS智能写作接入DeepSeek-Writer API，公文生成效率提升3倍，错误率下降90%

其他相关方

每日互动:幻方量化的二股东，为DeepSeek提供海量用户行为语料数据等卓创资讯:与幻方量化在金融语料库方面存在合作，其数据资源或用于Deepseek模型的训练和优化。航锦科技:旗下超警教智为DeepSeek提供光块和交换机，双方深度合作。

Deepseek助推异腾链前景

如上，DeepSeek更是宣布首发支持华为的昇腾平台，国产AI软件与硬件的强强联合，有望显著提升了模型推理效率，降低了用户的使用门槛。

华为昇腾产业链标的梳理