摘要:2月26日,和鲸社区精心策划了一场直播活动,邀请到了开源模型 DeepClaude 的开发者 Erlich,聊聊他眼中的 DeepClaude 使用场景, 以及如何使用和部署,帮助大家更好的进行工作。
最近 DeepSeek 的思考过程和推理能力再次燃起开发者的热情。
2月26日,和鲸社区精心策划了一场直播活动,邀请到了开源模型 DeepClaude 的开发者 Erlich,聊聊他眼中的 DeepClaude 使用场景, 以及如何使用和部署,帮助大家更好的进行工作。
DeepClaude 可能是目前最强的 DeepSeek r1 组合用法。
借助 DeepSeek r1 独一份的思考能力 + 最强的综合模型 Claude 3.5 Sonnet = DeepClaude
此外,文末 ModelWhale × DeepSeek 限时特惠来袭!
SaaS 版惊爆价:9998元!团队版尊享 6 席位+ 1 年使用权+附赠 30 天免费算力;
更支持本地部署,打造您的机构级智能引擎!
Q1
DeepClaude 是什么?
ErlichLiu/DeepClaude 是一个开源项目,它借助 DeepSeek R1 的推理过程来启发和增强其他模型的输出能力。这样,用户无需等待下一次大模型能力升级,就能快速提升大模型的效果。社区用户在不同的使用场景下,评测出了最推荐的组合方式:
编程场景:deepclaude(DeepSeek R1 + Claude 3.5 Sonnet 的用法,截至 2025.02.24 前都是最强的)其他文字创作:deepgeminipro(DeepSeek R1 + Gemini 2.0 Pro)通俗来讲,我们现阶段只是缝合了 DeepSeek R1 的思考过程和用户的提问,并把这些内容⼀起交给下⼀个表现可能更好的大模型。
Q2
DeepClaude 是怎么来的
Erlich 开源项目地址:https://github.com/ErlichLiu/DeepClaude
Aider 的研究启发:https://aider.chat/2025/01/24/r1-sonnet.html
简介:
Aider 专注于开发编程助手。目前,几乎所有主流的编程助手都采用“架构师 + 执行者”的架构。Aider 研究发现,在这一架构下,使用 DeepSeek R1 作为架构师,Claude 3.5 Sonnet 作为执行者,并引入思考与反思的过程,最终实现的效果甚至优于 gpt-o1-preview,同时成本也大幅降低。
随后,Aider 的商业团队 getAsterisk 也开源了 Rust 编程语言版本的 DeepClaude:https://github.com/getAsterisk/deepclaude,仅用DeepSeek R1的推理过程与用户问答内容进行拼接,并提供了对应的体验网站:https://deepclaude.com.
Q3
ErlichLiu/DeepClaude 做了什么?
上文提到的 Aider 团队,他们展示了 Demo,但没有做更深入的开发,并且不支持 OpenAI 的兼容模式。我们今天使用的大部分 AI 相关的软件,都是采用 OpenAI 兼容的标准。但因为我不会 Rust,所以完全按照我的理解重写了这个项目,并且做了 OpenAI 的兼容。
这样做的好处是你可以在几乎任何产品里使用这套可以提升大语言模型表现的 API,包括但并不限于:
开源聊天软件:ChatBox、Cherry Studio、LobeChat、NextChat、ChatWise 等编程插件:Roo Code、Cline 等大模型中转站:OneAPI、NewAPI 等这样对于稍微有一定动手能力,以及对大模型有更高期望的用户,就可以非常方便地使用起来了。
Q4
有了 Claude 3.7 Sonnet 推理的情况下,还需要 DeepClaude 吗?
2025 年 2 月 24 日凌晨,Claude 发布了 Claude 3.7 Sonnet 融合推理模型。相比于之前的 Claude 3.5 Sonnet,Claude 3.7 Sonnet 现在具备了类似 DeepSeek R1 的长思考能力,并能利用这一推理过程提升问答效果。此前,Claude 3.5 Sonnet 已在开发者等专业用户群体中广受好评,而本次增强推理能力后,其表现更为出色。
DeepClaude 的能力和优化空间其实还远不止于此。DeepClaude 并不是完全围绕着 Claude 展开的,也不存在竞争的关系,比如我们现在在文本生成上,社区用户在 Claude 3.7 Sonnet 推出后仍然认为 deepgeminipro 的表现更好。所以更深入地理解 DeepClaude 还要回到原理上。
Q5
DeepClaude 更深层的原理,以及下个阶段的发展?
Prompt 的本质是对高维智慧结晶的定向活化,就像在复杂的神经网络中划出一条明确的思维通路。每一次输入都是一次必然的维度塌缩,而 Prompt 的艺术在于让这种塌缩指向最有价值的方向。
无论是 DeepSeek R1、Claude 3.7 Sonnet 以及 DeepClaude 的组合,其实大家都是通过延长思考的过程,在这个思考和推理的过程中,我们通过更高质量的 COT 以及反思过程的 Prompt,一起来强化人类有限的表达能力,从而获得更精准的知识语意的定位,并激活这些部分的参数获得更好的回答效果。
当我们能理解这一点,并能理解 MOE 模型本身的限制时,其实就可以理解 DeepClaude 采用的是更上层灵活的组合方案,并且我们可以通过不同的组合方法,来继续在不同的细分领域实现更好的效果。甚至在 效果/成本>1 的场景里还可以用 Claude 3.7 Sonnet 的思考过程来启发 Gemini 2.0 Pro,也有可能效果会更好。
DeepClaude 还有另外一条很重要的发展方向,我们可以不断地优化引导思考模型的思考方式,这也是我们最积极的贡献者 GowayLee 提出来的。比如可以将用户的输入先用更快更低的模型来做一次处理,然后启发出更好的思考过程,继续将更好的思考过程传递下去给更强的综合能力更强的 LLM,那么我们就可以做到更好的效果。在这个过程中有非常大的优化空间,在效果和成本之间,也存在近乎无限种更好的可能。
用户评价
DeepClaude 虽然开始于 DeepSeek R1 + Claude 3.5 Sonnet,但是目前 DeepClaude 不只是 DeepClaude,还衍生出来了 DeepGemini 系列,目前在文字创作者上,DeepGemini 系列的表现甚至好于 DeepClaude。
DeepClaude 部署
自行部署 DeepClaude 等组合模型的方案:
你可以直接访问开源项目:
https://github.com/ErlichLiu/DeepClaude 自行部署。
此外,和鲸现已支持零门槛专享 DeepSeek 满血版,助力机构级 AI 业务创新。您可在 ModelWhale 灵活选择,一键部署、轻松打造专属 DeepSeek 应用。
限时特惠 9998 元即可尊享 ModelWhale SaaS 方案,可访问和鲸官网 AI.heywhale.(括号删除).com/deepseek
零门槛部署 DeepSeek,可在和鲸官网咨询
来源:和鲸