DeepSeek突曝异常！原因竟然是…

摘要：有人说它是“另一个 Mistral”，也有人调侃它“还没学会走路，就要挑战 OpenAI”。更有意思的是，规模不大的DeepSeek 官方特别具有的“神秘感”——低调、不回应、不解释，甚至没有一篇正式的技术博客，让它的一切更添悬念。

作者 I 钱游报道 I 电商最前线

大家新春快乐，在庆祝新年的同时，最火的话题，非 DeepSeek 莫属。

一边是铺天盖地的赞誉，称它为“中国 AI 之光”。

图源：deepseek官网

另一边，则是无休止的质疑，围绕模型来源、参数规模、实际能力等问题展开。

甚至这个新生儿——deepseek也遭遇了大批外国黑客攻击。

图源：deepseek

有人说它是“另一个 Mistral”，也有人调侃它“还没学会走路，就要挑战 OpenAI”。更有意思的是，规模不大的DeepSeek 官方特别具有的“神秘感”——低调、不回应、不解释，甚至没有一篇正式的技术博客，让它的一切更添悬念。

DeepSeek 是谁？它做了什么？

如果不是最近的这波热潮，大多数人恐怕都没听说过 DeepSeek。

这家于2023年成立的人工智能模型AGI研发商，创始人为年轻有为的梁文峰。

图源：企查查

真正让 DeepSeek 出圈的，是 2024 年 1 月发布的 DeepSeek-V2，以及最近的 DeepSeek-VL（多模态模型）。

DeepSeek-V2 一出场就放出豪言——“全面对标 GPT-4”，甚至直接把自己的性能标注在 GPT-4 之上。消息一出，业界瞬间炸锅。

图源：deepseek

有人兴奋地认为，中国终于迎来了真正能对抗 OpenAI 的大模型；但也有人提出了尖锐的质疑：

其一，2360 亿参数的 MoE？真的假的？

据悉，DeepSeek-V2声称是一个 2360 亿参数的 MoE 模型，但它的实际调用成本却并不高，很多测试者表示 API 费用和大多数 MoE 模型（如 Mistral）相似。

这引发了怀疑：DeepSeek 真的训练了一个这么大的模型，还是用了别的优化策略？

其二，评测数据是否“手搓”了？

在DeepSeek 发布的各种评测里，它的表现大幅领先 GPT-4，但很多真实测试者发现，DeepSeek 在某些任务上表现不如 GPT-4，甚至比 LLaMA3 还弱。

这让人怀疑，评测是否经过“特殊优化”？

其三，训练数据从哪来？

DeepSeek 号称自己是“中文最强大模型”，但没有公开详细的训练数据来源。

众所周知，大模型的能力很大程度上取决于训练数据，而中国公司受限于数据合规问题，获取高质量训练数据并不容易。DeepSeek 究竟是如何解决这个问题的？

另外，商业化怎么搞？

OpenAI 靠着 ChatGPT、API 订阅、大客户合作，已经建立起了一个清晰的商业模式，而 DeepSeek 目前的盈利模式却并不明朗。

要做 MoE 这样大规模的模型，算力消耗巨大，如果没有稳定的盈利渠道，如何长期运作？

为什么DeepSeek突然爆火？

遭遇全球猎巫

当前，Deepseek虽好用，但其服务器压力增大，部分功能无法正常使用，比如深度思考以及联网功能有时会“宕机”。

这或许就归因于国外黑客对于Deepseek的网络攻击。

图源：deepseek

Meta的扎克伯格表示对DeepSeek不感到担忧，反而肯定开源路径，而微软的纳德拉认为DeepSeek顺应了AI成本下降的趋势。

Anthropic的CEO Amodei批评DeepSeek的成本优势不明显，并呼吁美国加强芯片管制。

OpenAI和微软因涉嫌违规蒸馏已取消DeepSeek的API接口权限。

此外，DeepSeek在数据安全方面受到爱尔兰和意大利等国的质询，其应用在意大利被下架。

目前，DeepSeek在AI领域引发的争论和影响仍在持续。

在电商最前线看来，DeepSeek遭遇全球“猎巫”，也可以反映出这款来自中国的AI对于世界的影响力。

而这其中既有自身的技术能力，也有市场环境的推波助澜。

电商最前线认为，我们中国AI需要一个“希望”，而这个希望就是Deep seek。自从 ChatGPT 爆火以来，国内市场一直期待出现能真正抗衡 OpenAI 的大模型。

然而，过去一年，我们的AI 表现其实不尽如人意:

百度的文心一言，在体验和生态上仍未能真正与 GPT-4 竞争；

阿里这边的通义千问，虽然进步很快，但距离“顶级大模型”仍有差距；

再说字节的豆包，一开始很有话题度，但近期低调很多；

另外，好比说商汤、智谱等玩家，也各有短板。

相比之下，DeepSeek 这次直接“对标OpenAI o1”，让许多国内 AI 从业者看到了希望。

电商最前线制图

无论真假，大家都希望能出现一个真正能对抗 OpenAI 的国产 AI。

DeepSeek 并没有像 OpenAI 那样发布详细的技术文档，也没有大张旗鼓地宣传，而是悄悄上线，迅速引发讨论。没有论文，没有详细技术说明，但凭借优秀的产品体验和低调神秘的运营，一步步站稳了脚跟。

DeepSeek 目前采取的正是类似的策略是不主动回应争议；不解释技术细节，让外界自行猜测；只放出几个有冲击力的数据（2360 亿参数、超越 OpenAI o1评测等），让大家自行传播。

图源：小红书

这种“留白营销”，反而让它的讨论度持续上升。 DeepSeek 背后有一系列投资方，其中包括一些国内知名科技公司。

无论是真正的技术突破，还是资本推动的市场策略，DeepSeek 已经成为国内 AI 领域新的“话题之王”。对于资本市场来说，一个新的“AI 龙头”意味着新的投资机会。

在 OpenAI 估值飙升到 800 亿美元的背景下，国内资本市场也迫切需要一个类似的 AI 独角兽。

DeepSeek 的出现，正好迎合了这种市场需求。

据《日本经济新闻》网站1月30日报道，关于deepseek开发的生成式人工智能(AI)服务，日本内阁官房长官林芳正在30日的记者会上表示：“未听说个人信息保护委员会确定特别应对方针。”

据悉，他还指出：“将密切关注AI相关国际开发动向等，采取妥善应对措施。”

而关于生成式AI服务，林芳正再次表示：“同时促进创新和应对风险非常重要。”

与此同时，报外媒报道，美国众议院首席行政事务官向国会办公室发出通知，警告国会办公室不要使用中国的人工智能应用DeepSeek的服务。

该通知说：“当前，DeepSeek正在接受首席行政事务官的审查，目前尚未授权众议院正式使用该模型。”

据悉，这个低成本中国人工智能（AI）模型的出现威胁到了开放人工智能研究中心（OpenAI）和谷歌等美国人工智能领先者的市场主导地位。

DeepSeek 能成为中国的 OpenAI 吗？

从目前的情况来看，DeepSeek 确实在技术上有一定实力，但要真正成为“中国的 OpenAI”，它仍然面临许多挑战。

首先是，技术深度仍有待验证。

DeepSeek-R1 的真实能力，还需要更多的公开测试。它是否真的能超越 OpenAI o1？

目前的评测数据仍然存疑，用户反馈也不一致。

其次，是缺乏应用生态。

OpenAI 之所以成功，不只是因为算法强大，而是因为它有一个完整的生态系统——ChatGPT、API 订阅、插件系统、企业合作等。而我们的DeepSeek 目前虽然有 API，但尚未形成足够强的生态。

最后，是数据与法规问题。

我们知道，AI 训练需要大量高质量数据，而中国市场的监管环境更加复杂。DeepSeek 如果要继续成长，如何获取合规的数据，将是一个长期挑战。

此外，目前 DeepSeek 仍然处于“技术曝光”阶段，真正的商业模式还不明确。

如果未来无法形成稳定的盈利模式，那么烧钱换市场的策略，很可能难以长期持续。写在最后，DeepSeek 这次的爆火，证明了中国 AI 赛道的活力，也显示出市场对国产 AI 巨头的期待。但 AI 竞赛是一个“无限游戏”——它不会在某个时间点结束，而是持续演进。

而至于DeepSeek 这次能否站稳脚跟，关键在于它是否能在未来 6-12 个月内，持续拿出过硬的技术、产品和生态。 如果它真的能做出 GPT-4 级别的大模型，并且在应用层面打开局面，那么中国 AI 市场或许真的迎来了一个新的竞争者。 但如果只是短期的市场热度，而没有长期的技术积累和商业闭环，那 DeepSeek 很可能会成为下一个“昙花一现”的 AI 项目。接下来的几个月，将是 DeepSeek 的“真相时刻”。

来源：电商天下

标签： deepseek moe 林芳正

本文地址：https://news.43u.com.cn/a/585612.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!