DeepSeek突曝异常!原因竟然是…

360影视 2025-02-05 11:22 3

摘要:有人说它是“另一个 Mistral”,也有人调侃它“还没学会走路,就要挑战 OpenAI”。 更有意思的是,规模不大的DeepSeek 官方特别具有的“神秘感”——低调、不回应、不解释,甚至没有一篇正式的技术博客,让它的一切更添悬念。

作者 I 钱游 报道 I 电商最前线

大家新春快乐,在庆祝新年的同时,最火的话题,非 DeepSeek 莫属。

一边是铺天盖地的赞誉,称它为“中国 AI 之光”

图源:deepseek官网

另一边,则是无休止的质疑,围绕模型来源、参数规模、实际能力等问题展开。

甚至这个新生儿——deepseek也遭遇了大批外国黑客攻击。

图源:deepseek

有人说它是“另一个 Mistral”,也有人调侃它“还没学会走路,就要挑战 OpenAI”。 更有意思的是,规模不大的DeepSeek 官方特别具有的“神秘感”——低调、不回应、不解释,甚至没有一篇正式的技术博客,让它的一切更添悬念。

DeepSeek 是谁?它做了什么?

如果不是最近的这波热潮,大多数人恐怕都没听说过 DeepSeek。

这家于2023年成立的人工智能模型AGI研发商,创始人为年轻有为的梁文峰。

图源:企查查

真正让 DeepSeek 出圈的,是 2024 年 1 月发布的 DeepSeek-V2,以及最近的 DeepSeek-VL(多模态模型)。

DeepSeek-V2 一出场就放出豪言——“全面对标 GPT-4”,甚至直接把自己的性能标注在 GPT-4 之上。 消息一出,业界瞬间炸锅。

图源:deepseek

有人兴奋地认为,中国终于迎来了真正能对抗 OpenAI 的大模型;但也有人提出了尖锐的质疑:

其一,2360 亿参数的 MoE?真的假的?

据悉,DeepSeek-V2声称是一个 2360 亿参数的 MoE 模型,但它的实际调用成本却并不高,很多测试者表示 API 费用和大多数 MoE 模型(如 Mistral)相似。

这引发了怀疑:DeepSeek 真的训练了一个这么大的模型,还是用了别的优化策略?

其二,评测数据是否“手搓”了?

在DeepSeek 发布的各种评测里,它的表现大幅领先 GPT-4,但很多真实测试者发现,DeepSeek 在某些任务上表现不如 GPT-4,甚至比 LLaMA3 还弱。

这让人怀疑,评测是否经过“特殊优化”?

其三,训练数据从哪来?

DeepSeek 号称自己是“中文最强大模型”,但没有公开详细的训练数据来源。

众所周知,大模型的能力很大程度上取决于训练数据,而中国公司受限于数据合规问题,获取高质量训练数据并不容易。DeepSeek 究竟是如何解决这个问题的?

另外,商业化怎么搞?

OpenAI 靠着 ChatGPT、API 订阅、大客户合作,已经建立起了一个清晰的商业模式,而 DeepSeek 目前的盈利模式却并不明朗。

要做 MoE 这样大规模的模型,算力消耗巨大,如果没有稳定的盈利渠道,如何长期运作?

为什么DeepSeek突然爆火?

遭遇全球猎巫

当前,Deepseek虽好用,但其服务器压力增大,部分功能无法正常使用,比如深度思考以及联网功能有时会“宕机”。

这或许就归因于国外黑客对于Deepseek的网络攻击。

图源:deepseek

Meta的扎克伯格表示对DeepSeek不感到担忧,反而肯定开源路径,而微软的纳德拉认为DeepSeek顺应了AI成本下降的趋势。

Anthropic的CEO Amodei批评DeepSeek的成本优势不明显,并呼吁美国加强芯片管制。

OpenAI和微软因涉嫌违规蒸馏已取消DeepSeek的API接口权限。

此外,DeepSeek在数据安全方面受到爱尔兰和意大利等国的质询,其应用在意大利被下架。

目前,DeepSeek在AI领域引发的争论和影响仍在持续。

在电商最前线看来,DeepSeek遭遇全球“猎巫”,也可以反映出这款来自中国的AI对于世界的影响力。

而这其中既有自身的技术能力,也有市场环境的推波助澜。

电商最前线认为,我们中国AI需要一个“希望”,而这个希望就是Deep seek。自从 ChatGPT 爆火以来,国内市场一直期待出现能真正抗衡 OpenAI 的大模型。

然而,过去一年,我们的AI 表现其实不尽如人意:

百度的文心一言,在体验和生态上仍未能真正与 GPT-4 竞争;

阿里这边的通义千问,虽然进步很快,但距离“顶级大模型”仍有差距;

再说字节的豆包,一开始很有话题度,但近期低调很多;

另外,好比说商汤、智谱等玩家,也各有短板。

相比之下,DeepSeek 这次直接“对标OpenAI o1”,让许多国内 AI 从业者看到了希望。

电商最前线制图

无论真假,大家都希望能出现一个真正能对抗 OpenAI 的国产 AI。

DeepSeek 并没有像 OpenAI 那样发布详细的技术文档,也没有大张旗鼓地宣传,而是悄悄上线,迅速引发讨论。 没有论文,没有详细技术说明,但凭借优秀的产品体验和低调神秘的运营,一步步站稳了脚跟。

DeepSeek 目前采取的正是类似的策略是不主动回应争议;不解释技术细节,让外界自行猜测; 只放出几个有冲击力的数据(2360 亿参数、超越 OpenAI o1评测等),让大家自行传播。

图源:小红书

这种“留白营销”,反而让它的讨论度持续上升。 DeepSeek 背后有一系列投资方,其中包括一些国内知名科技公司。

无论是真正的技术突破,还是资本推动的市场策略,DeepSeek 已经成为国内 AI 领域新的“话题之王”。 对于资本市场来说,一个新的“AI 龙头”意味着新的投资机会。

在 OpenAI 估值飙升到 800 亿美元的背景下,国内资本市场也迫切需要一个类似的 AI 独角兽。

DeepSeek 的出现,正好迎合了这种市场需求。

据《日本经济新闻》网站1月30日报道,关于deepseek开发的生成式人工智能(AI)服务,日本内阁官房长官林芳正在30日的记者会上表示:“未听说个人信息保护委员会确定特别应对方针。”

据悉,他还指出:“将密切关注AI相关国际开发动向等,采取妥善应对措施。”

而关于生成式AI服务,林芳正再次表示:“同时促进创新和应对风险非常重要。”

与此同时,报外媒报道,美国众议院首席行政事务官向国会办公室发出通知,警告国会办公室不要使用中国的人工智能应用DeepSeek的服务。

该通知说:“当前,DeepSeek正在接受首席行政事务官的审查,目前尚未授权众议院正式使用该模型。”

据悉,这个低成本中国人工智能(AI)模型的出现威胁到了开放人工智能研究中心(OpenAI)和谷歌等美国人工智能领先者的市场主导地位。

DeepSeek 能成为中国的 OpenAI 吗?

从目前的情况来看,DeepSeek 确实在技术上有一定实力,但要真正成为“中国的 OpenAI”,它仍然面临许多挑战。

首先是,技术深度仍有待验证。

DeepSeek-R1 的真实能力,还需要更多的公开测试。它是否真的能超越 OpenAI o1?

目前的评测数据仍然存疑,用户反馈也不一致。

其次,是缺乏应用生态。

OpenAI 之所以成功,不只是因为算法强大,而是因为它有一个完整的生态系统——ChatGPT、API 订阅、插件系统、企业合作等。而我们的DeepSeek 目前虽然有 API,但尚未形成足够强的生态。

最后,是数据与法规问题。

我们知道,AI 训练需要大量高质量数据,而中国市场的监管环境更加复杂。DeepSeek 如果要继续成长,如何获取合规的数据,将是一个长期挑战。

此外,目前 DeepSeek 仍然处于“技术曝光”阶段,真正的商业模式还不明确。

如果未来无法形成稳定的盈利模式,那么烧钱换市场的策略,很可能难以长期持续。 写在最后,DeepSeek 这次的爆火,证明了中国 AI 赛道的活力,也显示出市场对国产 AI 巨头的期待。 但 AI 竞赛是一个“无限游戏”——它不会在某个时间点结束,而是持续演进。

而至于DeepSeek 这次能否站稳脚跟,关键在于它是否能在未来 6-12 个月内,持续拿出过硬的技术、产品和生态。 如果它真的能做出 GPT-4 级别的大模型,并且在应用层面打开局面,那么中国 AI 市场或许真的迎来了一个新的竞争者。 但如果只是短期的市场热度,而没有长期的技术积累和商业闭环,那 DeepSeek 很可能会成为下一个“昙花一现”的 AI 项目。 接下来的几个月,将是 DeepSeek 的“真相时刻”。

来源:电商天下

相关推荐