DeepSeek思考

360影视 2025-02-10 10:02 3

摘要:DeepSeek 超越了 Meta Llama 毫无疑问,但相比 OpenAl、Anthropic 和 Google 这些第一梯队players 还有距离。比如 Gemini 2.0 Flash 成本比 DeepSeek 更低,能力也很强,且全态,外界低估了

1.DeepSeek 超越了 Meta Llama 毫无疑问,但相比 OpenAl、Anthropic 和 Google 这些第一梯队players 还有距离。比如 Gemini 2.0 Flash 成本比 DeepSeek 更低,能力也很强,且全态,外界低估了 Gemini 2.0 为代表的第一梯队的能力,只是没有开源而获得这么炸裂轰动性的效果。

DeepSeek 很让人兴奋,但还不能称作范式级创新更准确的表述是开源了之前 OpenAl o1 半遮半掩的秘密,将整个生态推向很高渗透率。如果说OpenAl 最初发布的 01 是给行业出了一个谜语DeepSeek 就是第一个公开解谜的人。DeepSeek发布 R1和 R1-zero 之前,行业只有少部分人在实践 RL 和 reasoning model,但 DeepSeek 给大家指明了路线图,让行业相信这样做真的能提升智能,这对提升信心,吸引更多 Alresearcher 转向新范式的研究有巨大的帮助。

另外,reasoning model 的提升会进一步帮助茨现在都因Me的研究和探索更有信心,因此也可以说 DeepSeek开源 reasoning model 推进了行业向 Agent 的进

一步探索。

从第一性原理角度,在 Transformer 这一代架构下

超越第一梯队模型厂商是有难度的。今天更期待有人

能探索出下一代的智能架构和范式。

2.Anthropic 的技术路线和 R1 有什么不同?Dario 觉得 base model与 reasoning model 应该是个连续光谱,而非 OpenAl 这种独立的模型系列。如果只做 0 系列会很快遇到天花板。为什么sonnet 3.5的coding、reasoning 和 Agentic 能力一下子提升这么强,但 40一直没追上?可能他们在 pre trAIning base model 阶段就做了大量RL 工作,核心还是把 base model 提上去,不然只靠 RL 提升 reasoning model 可能很容易把收益吃光。

3.谁受伤?谁受益?

分 3 类:ToC、TO

Developer 以及To Enterprise( toGovernment)。ToC:Chatbot 肯定受冲击最大心智和品牌关注度被 DeepSeek 抢走了,ChatGPT 也不例外;to B影响很有限,我们看到有开发者用完之后评论 r1 不好用不如 sonnet,Cursor 官方也说 Sonnet 还是 outperform,用户并没有大幅迁移;第三个维度,ToEnterprise 和To Government 的生意在于信任和需求理解,大型组织做决策的利益考虑很复杂,不会像 C 端用户那么容易迁移。

中长期看,GPU 资源充裕的公司还是受益的,一方面是第二梯队的 Meta 可以快速跟进新方法Capex 更加 efficient,Meta 可能是很大受益者另一方面是智能提升还需要更多探索,DeepSeek开源把大家水平拉齐,进入全新探索又需要 10 倍甚至更大量级的 GPU 投入。

从第一性原理来想,对于 AI 智能产业来说,无论是发展智能还是应用智能,从物理本质上就必然要消耗海量算力,这是基础定律决定的,不是技术优化能完全规避的。这也解释了为什么马斯克从第一性原理出友,XAI建集群,xAI 和 Stargate 背后的深层逻辑也许是一样的。

4.没有护城河。Google 之前对 OpenAl 的一个评价:No Moat!这句话放在这里也很应景。

DeepSeek 这一波 Chatbot 用户又出现了大量迁移现象,给了市场一个很重要的启发:智能技术进步非常陡峭,阶段性产品很难形成绝对壁垒。

不管是 ChatGPT/Sonnet/Perplexity 刚形成了心智和口碑,还是 Cursor、Windsurf 这类开发者工具,一旦有了更智能的产品,用户对“上一代”智能的产品毫无忠诚度,今天不管是模型层还是应用层都很难构建护城河。

5.DeepSeek 应该承接这波 Chatbot 流量并做大吗?通过 DeepSeek 团队的反应可以明显感觉出来DeepSeek 还没想好怎么用这波流量。这个问题的本质是,伟大的商业公司和伟大的researchlab 能共存在一个组织吗?这件事非常考验精力和资源分配、组织能力和战略选择,如果是字节、Meta 这类份个的年、37交都组织基础可以接下来,但 DeepSeek 作为一个research lab 组织,承接这波巨量流量的压力必然很大。但同时也要想这一波 Chatbot 会是阶段性流量吗?Chatbot 是不是在未来智能探索的主线下?如果 AGI 最终实现了,而 Chatbot 只是解锁的其中一个早期形态,最终又会是什么载体来承接?

6.下一个智能突破的 Aha moment 从哪来?一方面,第一梯队的下一代模型很关键,但 OpenA1、Anthropic 和 Google 作为回应发个提高30-50% 的模型,可能都不够挽回局势,因为他们资源多了 10-30 倍。Agent 落地就会比较关键,因为 Agent 需要做长距离多步骤推理,如果模型好5-10%,领先的效果就会被放大很多倍。所以OpenAl、Anthropic 和 Google -方面要做Agent 产品落地,full stack 集成模型+Agent产品,就像 Windows+Office,二是也要 show 出来更强大的模型,比如 03 完整版、Sonnet 4/3.5opus 为代表的下一代模型

来源:全产业链研究

相关推荐