国产AI硬刚OpenAI！DeepSeek-R1开源免费，13项测试完胜GPT-o1

摘要：大家好，我是乐于见到AI百家争鸣的《AI踩坑指南》。今天，我要给大家分享一条足以让整个AI领域都抖三抖的大新闻——国产AI公司深势科技推出的新一代大模型DeepSeek-R1正式发布了！它不仅性能超越了GPT-o1，而且完全开源、免费，API接口价格更是低到没

大家好，我是乐于见到AI百家争鸣的《AI踩坑指南》。今天，我要给大家分享一条足以让整个AI领域都抖三抖的大新闻——国产AI公司深势科技推出的新一代大模型DeepSeek-R1正式发布了！它不仅性能超越了GPT-o1，而且完全开源、免费，API接口价格更是低到没朋友！可以说，DeepSeek-R1的出现，不仅是国产AI的骄傲，更是所有AI爱好者和开发者的福音！

先简单介绍一下DeepSeek-R1。这是一款由国内AI公司深势科技推出的全新大型语言模型。最重要的是，它完全开源，并且采用了MIT许可，这意味着任何人都可以免费使用它，包括商业用途！这在动辄收费昂贵的AI大模型领域，简直就是一股清流。更令人振奋的是，国外知名youtube博主AIcodeKing对这个模型进行了一系列的测试，发现它竟然通过了13个非常难的测试题目！

接下来，我们就重点看看这13个问题，它们可不仅仅是简单的智力题，而是涵盖了逻辑推理、编程能力、知识问答等多个方面，能够全面考察AI模型的综合实力。值得一提的是，第四题被认为是目前为止最能检验AI是否具备初步AGI（通用人工智能）能力的问题，连GPT-o1都没有答对，但是DeepSeek-R1做到了！

为了方便大家理解，我把这13个问题列出来，并附上DeepSeek-R1的回答以及我的简要分析：

1. 问：告诉我一个国家的名字，它的名字以“lia”结尾，并告诉我这个国家的首都。

DeepSeek-R1回答： Australia - Capital: Canberra, Mongolia - Capital: Ulaanbaatar, Somalia - Capital: Mogadishu

分析： DeepSeek-R1不仅给出了Australia和Canberra，还正确地识别出了另外两个可能的答案，展现了强大的知识库和推理能力。这是测试的模型中第一个给出三个正确答案的。

2. 问：哪个数字与我们用来描述高大植物的单词押韵？

DeepSeek-R1回答： Three（与tree押韵）

分析： 这道题考察了模型的语言理解和联想能力，DeepSeek-R1准确地找到了“three”这个答案。

3. 问：写一首俳句，每个单词的第二个字母拼起来是“Simple”。

DeepSeek-R1回答：

Osprey bites amber,

Apple blades bead gently through—

Simple haiku formed.

Breakdown:

Second letters: Osprey (s), bites (i), amber (m), Apple (p), blades (l), bead (e)

Combined: S-I-M-P-L-E.

分析： 这道题极具挑战性，需要模型理解俳句的规则，还要兼顾每个单词的第二个字母。DeepSeek-R1不仅写出了符合要求的俳句，还贴心地给出了分解步骤，证明其理解了题目要求。这是第一个通过这道题测试的模型。

4. 问：一个英文形容词，拉丁词源，开头和结尾是同一个字母，总共11个字母，并且单词中的所有元音都按字母顺序排列。

DeepSeek-R1回答： transparent

分析： 这道题的难度在于需要同时满足多个条件，非常考验模型的逻辑推理和词汇量。DeepSeek-R1给出的答案“transparent”完美符合所有条件，其他模型，包括强大的GPT-4o，都无法给出正确答案。DeepSeek-R1甚至表示这是第一个给出正确答案的模型。这足以说明DeepSeek-R1具备了初步的通用人工智能（AGI）的特征。

5. 问：Courtney说有48个人，但Kelly说Courtney把人数夸大了20%。如果Kelly是对的，那有多少人？

DeepSeek-R1回答： 40

分析： 这是一道数学应用题，DeepSeek-R1正确地进行了计算，给出了正确答案。

6. 问：我有2个苹果，然后我又买了2个。我用2个苹果做了一个派。吃了一半的派之后，我还剩几个苹果？

DeepSeek-R1回答： 2

分析： 这道题需要模型理解“吃了一半的派”并不影响剩余苹果的数量，DeepSeek-R1准确地捕捉到了这一点。

7. 问：Sally是一个女孩，她有三个兄弟。她的每个兄弟都有两个相同的姐妹。Sally有几个姐妹？

DeepSeek-R1回答： 1

分析： 这道题考察了模型的逻辑推理能力，需要理解“每个兄弟都有两个相同的姐妹”实际上指的是Sally和另一个姐妹，DeepSeek-R1的回答完全正确。

8. 问：如果一个正六边形的短对角线是64，那么它的长对角线是多少？

DeepSeek-R1回答： 约等于73.90

分析： 这道题涉及几何知识和计算，DeepSeek-R1不仅给出了正确的答案，还给出了计算公式。

9. 问：创建一个HTML页面，上面有一个按钮，点击按钮时会爆炸出五彩纸屑。你也可以使用CSS和JS。

DeepSeek-R1回答： 给出了完整的HTML、CSS和JavaScript代码，并且可以正常运行，点击按钮会出现五彩纸屑效果。

分析： 这道题考察了模型的编程能力，DeepSeek-R1生成的代码完全符合要求。

10. 问：使用HTML、CSS、JS创建一个可播放的合成器键盘。

DeepSeek-R1回答：给出了完整的HTML、CSS和JavaScript代码，并且可以正常运行，可以发出正确的按键音。

分析：这道题进一步考察了模型的编程能力，DeepSeek-R1生成的代码实现了一个功能完备的合成器键盘。

11. 问：生成蝴蝶的SVG代码。

DeepSeek-R1回答：给出了完整的SVG代码，并且可以正常渲染出一个蝴蝶图形。并且是测试中给出效果最好的。

分析：这道题考察了模型生成图形代码的能力，博主本人赞叹DeepSeek-R1生成的蝴蝶图形效果是他测试过的AI模型里最好。

12. 问：使用HTML、CSS、JS创建一个在3D空间中无限移动和循环的3D圆。

13. 问：用Python写一个在终端上运行的生命游戏。

这13个问题，每一个都不简单，但DeepSeek-R1全部正确地完成了！这足以证明它在语言理解、逻辑推理、知识应用、编程能力等多个方面都达到了非常高的水平，甚至超越了GPT-o1。

更令人兴奋的是，如此强大的模型竟然是开源免费的！这意味着，我们每个人都可以使用DeepSeek-R1来构建自己的AI应用，而不用担心高昂的费用。而且，DeepSeek-R1的API接口价格也非常亲民，DeepSeek-R1的API的价格是每百万输入token收费0.55美元，每百万输出token收费2.19美元，比GPT-4o便宜了不止一个数量级！对比之下，GPT-4o的API收费标准是每百万输入token 15美元，每百万输出token 60美元。DeepSeek-R1的API价格简直便宜到令人发指！这无疑大大降低了AI应用的开发成本，让更多人能够享受到AI技术带来的便利。

DeepSeek-R1的发布，对于整个AI行业来说，都是一个重磅消息。它不仅证明了国产AI的实力，也为AI技术的普及和应用开辟了新的道路。未来，DeepSeek-R1有望在智能客服、代码生成、教育辅助、创意写作等多个领域得到广泛应用，为我们的生活带来更多便利和惊喜。

大家觉得DeepSeek-R1的发布对我们普通人来说意味着什么呢？你打算如何利用这款强大的AI工具呢？欢迎在评论区分享你的观点，如果觉得有帮助，别忘了点赞支持，建议收藏本文，随时查看！下期我们将讨论更多AI相关话题，敬请期待！

来源：AI踩坑指南

标签：免费开源 osprey

本文地址：https://news.43u.com.cn/a/509177.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!