黑马DeepSeek再次搅动AI江湖!投资机会在哪里?

360影视 2025-01-27 09:23 2

摘要:目前普遍认为DeepSeek的R1 发布标志着推理模型研究的重要转折点,而在此之前推理模型一直是工业研究的重要领域,但缺乏一篇开创性的论文,就像 AlphaGo 使用强化学习下了无数盘围棋并优化其策略以获胜一样,DeepSeek 正在使用相同的方法来提升其能力

一个多月后,更炸街的DeepSeek-R1来了。

1月20日DeepSeek-R1 正式发布,R1-zero 采用的训练策略证明了仅通过强化学习,无需监督式微调,大模型也可以有强大的推理能力。

海外核心高管和AI从业人员的出圈消息(微软CE0和Scale AICEO对DS的评论、Meta员工的 Panic mode)引发市场重视。

目前普遍认为DeepSeek的R1 发布标志着推理模型研究的重要转折点,而在此之前推理模型一直是工业研究的重要领域,但缺乏一篇开创性的论文,就像 AlphaGo 使用强化学习下了无数盘围棋并优化其策略以获胜一样,DeepSeek 正在使用相同的方法来提升其能力,因此2025 年可能会成为强化学习的元年。

更关键的是DeepSeek 通过创新性的方法,在有限的计算资源下实现了这些突破。

性能评估结果显示,通过纯强化学习方法训练得到的 DeepSeek-R1-Zero 以及在此基础上改进的 DeepSeek-R1,在 2024 年AIME(美国数学邀请赛)测试中分别取得了 71.0% 和 79.8% 的成绩,与 OpenAI o1 的79.2% 水平相当。在 API 定价方面,DeepSeek 展现出极强的性价比优势。其 API 服务对输入 token 收取 0.55 美元/百万,输出 token 收取 2.19 美元/百万,而 OpenAI o1 的收费分别为 15 美元/百万和 60 美元/百万,价格差距接近 30 倍。

Deepseek R1 大战 GPT-01:测评视角

1、测试背景与目的

测试背景:为比较Deepseek R1与GPT-01的能力,采用多种学科的竞赛题进行测评。选择数学题作为主要测试方向,是因为数学具有标准化特点,对难度区分度更明确,能有效衡量模型的逻辑能力。同时,也会测试物理、化学等学科题目,以评估模型在跨学科方面的表现。测试目的:通过对不同类型题目(纯文字数学题、图形几何题、跨学科题目等)的测试,全面了解Deepseek R1与GPT-01在逻辑能力、推理速度、思维链展示以及跨学科知识堂握等方面的优势与不足,为评估两个模型的性能提供依据。

2、模型测试过程与结果

纯文字数学题测试:选择高中竞赛难度的纯文字数学题进行测试,如设有理数R属于0到1,R =P/Q(P、Q为互素的正整数,且PQ整除3600),求这样的有理数R的个数。结果显示,GPT-01和Deepseek R1都给出了正确答案112。在测试的七道题中,Deepseek R1的速度比GPT-01快了约-道题的时间。

图形几何题测试:以带图形的几何竞赛题测试,如正方体中内切圆相关的题目,答案为最小值三倍根号2减3,最大值是三倍根号6。GPT-01只答对了最小值,最大值答错;而Deepseek R1给出了错误答案。但在整体图形几何题测试中,DeepseekR1的速度比GPT-01快,目Deepseek R1全程显示思维链,GPT-4则是在推理结束后才展示精简过的思维链。

3、跨学科题目测试情况

物理题测试:选取物理竞赛题,要求计算恢复系数,正确答案是根号下(根号下H零分G加1M1分之M1加M2减1)。将题目由Deepseek翻译为英文后发给GPT-01,GPT-01给出错误答案。这表明在物理学科的竞赛题上,GPT-01表现不佳。

化学题测试:测试的化学题有带图片且包含多个小问。其中一题两个小问GPT-01都答错,答案分别应为208以及24.3纳米;而Deepseek给出了正确答案。另一道三个小问的化学题,Deepseek和GPT-01都做对了。这显示在化学学科测试中,Deepseek的表现优于GPT-01。4、模型对比与总结

·模型能力对比:从绝对逻辑能力来看,纯文字数学题方面,DeepseekR1与GPT-01水平相当;图形模态上,Deepseek R1强于GPT-01;跨学科题目中,两者较为接近,Deepseek R1有时答对的题目更多。不过,目前尚未完全对比GPT-01与Pro版的差异。模型发展总结:大模型发展至今,0penAI的领先优势在逐渐缩小,国内大模型如Deepseek的追赶速度较快。Deepseek官网流量增长迅速,从12月26日的44万涨至1月21日的420万,增长了约十倍,且外国用户占比较高,中国占比27.9%,位列第二第三的分别是埃及和俄罗斯,美国占比5%。这表明Deepseek在用户增长和国际影响力方面取得了一定成绩。

中国AI公司和开源模型的全面崛起:

随着 DeepSeek,Minimax等中国公司在 AI 领域的崛起,全球 AI 竟争格局正在发生微妙变化。如果中国公司能够以更低的成本实现同等或更好的性能开源大模型,海外开源和闭源模型或都受到挑战,此外应用端在字节豆包带动下持续对商业化场景展开探索,国内AI公司和开源模型或将持续推动大模型产业和相关AI应用的升级,

DeepSeek相关主要包括以下几类

股权关联方

浙江东方:通过旗下杭州东方嘉富基金参投Deepseek天使轮。华金资本:珠海国资旗下投资平台间接参与DeepSeekPre-A轮融资

算力基础设施供应商

浪潮信息:为Deepseek北京亦庄智算中心提供AI服务器集群及英伟达H800+自研AIStation管理平台。中科曙光:承建DeepSeek杭州训练中心液冷系统。润泽科技:廊坊数据中心为Deepseek提供3000+机柜资源

垂直领域合作方

拓尔思:与Deepseek联合开发金融奥情大模型,已在中信证券等机构部署智能研报生成系统,科大讯飞:在教育领域接入了DeepSeek-Math模型,并联合推出了AI数学辅导应用“星火助学”金山办公:WPS智能写作接入DeepSeek-Writer API,公文生成效率提升3倍,错误率下降90%

其他相关方

每日互动:幻方量化的二股东,为DeepSeek提供海量用户行为语料数据等卓创资讯:与幻方量化在金融语料库方面存在合作,其数据资源或用于Deepseek模型的训练和优化。航锦科技:旗下超警教智为DeepSeek提供光块和交换机,双方深度合作。

Deepseek助推异腾链前景

如上,DeepSeek更是宣布首发支持华为的昇腾平台,国产AI软件与硬件的强强联合,有望显著提升了模型推理效率,降低了用户的使用门槛。

华为昇腾产业链标的梳理

华丰科技:华为高速背板连接器核心供应商

泰嘉股份:旗下雅达电子与华为在服务器电源领域有合作

意华股份:内设华为专案工厂生产通讯连接器

华工科技、光迅科技:为华为光模块供应商

英维克、申菱环境、飞荣达:散热及温控供应商

本文源自智通财经APP

来源:金融界

相关推荐