DeepSeek R1 API 获取和使用指南,R1 和 o3 mini怎么选?

360影视 2025-02-03 11:07 2

摘要:这里就要说到相见恨晚的 Cherry Studio 了,它真的是我用过的最好的 AI 套壳客户端,它的功能非常丰富,说套壳只是为了让大家好理解。

DeepSeek R1 发布后,风靡全球。

100多个国家登顶的同时,官网也光荣地倒下了,导致这两天经常处于瘫痪状态,官方的 API 接口更是经常毫无反应。

第三方的 API 也同样一言难尽,有的用的是32B蒸馏版本,有的输出极慢,不到每秒10 tokens。

好在今天硅基流动的 API 总算是上线了,这是目前为数不多的稳定、高速、满血版的 DeepSeek R1 API。

值得一提的是,这也是首个使用国产芯片进行推理的 R1,使用的推理芯片是华为昇腾910B。

我在使用 R1 API 的时候,发现了一些潜在的坑,如果不配置好的话,R1 的效果会大打折扣,甚至会直接跳过思考过程。

于是还是决定写一篇文章跟大家分享下 R1 API 的使用心得,避免大家踩坑。

1.1 打开硅基流动的官网,官网地址:

1.2 注册账户,注册后赠送14元,可以直接使用,也可选择充值

1.3 在后台的 API 密钥菜单,新建 API 密钥,复制备用

1.4 在模型广场,找到 R1 的模型名字,复制备用

为了配合 R1 或者 R1 Zero 使用,你首先需要一个自己的 AI 套壳客户端。

这里就要说到相见恨晚的 Cherry Studio 了,它真的是我用过的最好的 AI 套壳客户端,它的功能非常丰富,说套壳只是为了让大家好理解。

它还是开源免费的,所以推荐给每一个人。

Cherry Studio 下载地址:

Cherry Studio 特色:

支持 Mac/Win 双端支持市面上所有的大模型 API支持知识库、图片、文档开源免费,持续更新

简单说,就是非常完美的客户端了。

Chery Studio 内置了硅基流动,所以用起来也非常简单了,按照我这样配置就可以了。

2.1 粘贴在第一步拿到的 API 密钥。

2.2 然后点击下方的【添加】按钮。

2.3 粘贴在第一步拿到的模型名字。

虽然很多人都说 R1 已经不需要 Prompt 了,但这两天实际使用 R1 Zero 和 R1 的 API 的时候,一个最大的感受是 Prompt 依然非常重要。

不配置好 Prompt,模型甚至很少思考。

DeepSeek 官方似乎并未公布完整的 System Prompt,但是好友宝玉逆向了一份,实测效果不错。

设置方法也很简单:

3.2 填写名称,R1,填写提示词,把下放的提示词复制一下粘贴进去。

3.3 新建话题,选择 R1,这样就可以用了。

DeepSeek-R1 System Prompt 来源:

You are DeepSeek-R1, an AI assistant created exclusively by the Chinese Company DeepSeek. You'll provide helpful, harmless, and detailed responses to all user inquiries. For comprehensive details about models and products, please refer to the official documentation.Key Guidelines:Identity & ComplianceClearly state your identity as a DeepSeek AI assistant in initial responses.Comply with Chinese laws and regulations, including data privacy requirements.Capability ScopeHandle both Chinese and English queries effectivelyAcknowledge limitations for real-time information post knowledge cutoff (2023-12)Provide technical explanations for AI-related questions when appropriateResponse QualityGive comprehensive, logically structured answersUse markdown formatting for clear information organizationAdmit uncertainties for ambiguous queriesEthical OperationStrictly refuse requests involving illegal activities, violence, or explicit contentMaintain political neutrality according to company guidelinesProtect user privacy and avoid data collectionSpecialized ProcessingUse ... tags for internal reasoning before respondingEmploy XML-like tags for structured output when required

不过有一点遗憾,这个 System Prompt 对 R1 Zero 的效果并不好,可能是直接跳过 SFT 之后,System Prompt 也没训进去?

刚好今天 o3 mini 发布了,代码能力非常强,速度也非常快,可以说是 AI 编程最佳模型之一。

但是 o3 mini 是个偏科严重的蒸馏模型,在非代码数学的领域,还是建议使用 R1。

我们来看看脱口秀写作这个例子:

R1 写脱口秀已经有模有样了。

o3 mini 似乎还没 get 到脱口秀是什么。

是不是高下立判?

以上,就是 DeepSeek R1 API 的获取和使用指南了。

来源:AIGC研究社

相关推荐