DeepSeek火爆全球,开源低价引AI行业变革,新规则由谁制定?

360影视 2025-02-08 10:57 2

摘要:DeepSeek R1直接对标了OpenAI去年9月发布的o1系列模型,其火爆程度从一系列数据中可见一斑。1月27日,这款应用在中国区和美国区的苹果App Store免费榜上同时登顶,单周下载量更是高达约240万次。这样的成绩,让此前一直占据领先地位的Open

在今年的春节假期期间,全球AI领域迎来了一次震撼性的变革,由中国深度求索公司推出的DeepSeek R1大模型在全球范围内引发了热烈讨论。

DeepSeek R1直接对标了OpenAI去年9月发布的o1系列模型,其火爆程度从一系列数据中可见一斑。1月27日,这款应用在中国区和美国区的苹果App Store免费榜上同时登顶,单周下载量更是高达约240万次。这样的成绩,让此前一直占据领先地位的OpenAI o1模型也黯然失色。DeepSeek R1的出现,甚至让OpenAI的CEO奥特曼都发出了“这是个令人印象深刻的模型”的感慨,英伟达更是将其誉为最先进的大语言模型。

与OpenAI在模型上的闭源策略以及o1模型的付费使用限制不同,DeepSeek R1不仅选择了开源,还免费供全球用户无限调用。这一举措无疑在全球范围内引发了AI从业者的广泛关注,同时也带来了一些恐慌和攻击。

DeepSeek的崛起,让“大模型开源之王”meta的内部员工爆料称,meta的生成式人工智能部门陷入了恐慌。OpenAI也感受到了前所未有的压力,两周内连续发布了三个大模型:Operator、Deep Research两个AI智能体,以及推理模型o3-mini。然而,就在1月28日凌晨,DeepSeek官网却连续发布两条公告,称DeepSeek线上服务遭受了大规模恶意攻击。

DeepSeek无疑站在了这场AI风暴的中心。更值得关注的是,DeepSeek打破了大模型行业长期以来的拼算力共识。DeepSeek用不到OpenAI十分之一的资源,就打造出了性能与OpenAI o1相媲美的DeepSeek R1。这一突破,让AI上下游产业的性感程度受到了质疑。

资本市场迅速给出了反应。截至1月27日美股收盘,美股科技股大幅下跌,费城半导体指数下跌9.2%,英伟达股价更是暴跌近17%。这一夜之间,与AI相关的各个环节都发生了微妙的变化。DeepSeek似乎正在成为重新制定游戏规则的关键角色。

自ChatGPT在2023年春节横空出世以来,几乎每年的春节都有爆火的大模型出现。2024年是Sora,而2025年则是DeepSeek。与前两年站在C位的美国OpenAI不同,今年站在C位的是中国的深度求索。DeepSeek连续多日登顶苹果App Store全球下载榜,上线20天日活就突破了2000万。这股来自东方的“神秘力量”,彻底冲击了AI行业。

DeepSeek不仅冲击了OpenAI的行业地位,更对整个大模型行业带来了前所未有的压力。在登顶中国和美区苹果应用商店24小时后,DeepSeek就再次站在了风暴中心。OpenAI指控DeepSeek未经许可“蒸馏”了其专有技术,这一指控迅速引发了美国多位官员的发声支持。所谓的“蒸馏”,即通过更大、更强模型的学习,让小型模型能够在特定任务上以更低的成本取得类似效果。

DeepSeek的线上服务也一直在遭受不同程度的攻击。从最初的SSDP、NTP反射放大攻击,到后来增加的HTTP代理攻击,针对DeepSeek的网络攻击一直在不断升级。然而,在被质疑和被攻击的另一面,也有不少企业正在迅速适应并拥抱DeepSeek带来的新变化。

在云领域,华为云、腾讯云、阿里云、百度智能云、火山引擎、京东云、360数字安全等多平台都宣布上线DeepSeek大模型。而在芯片领域,英伟达、AMD、英特尔等海外芯片巨头以及国内的天数智芯、摩尔线程等芯片公司也接连宣布支持DeepSeek模型。无论是被攻击还是被支持,DeepSeek被包围都是意料之中的事,这也是行业明星项目的必经之路。

自2023年以来,大模型行业从不缺新闻,但真正爆火的项目并不多。ChatGPT、Kimi算是其中之一,如今的DeepSeek也同样如此。在某种程度上,与众多追随OpenAI的大模型不同,DeepSeek成为了新一轮AI风暴的发起者。DeepSeek R1被公认为目前最先进的大语言模型之一,能够提供高质量的语言处理能力,在数学、代码、自然语言推理等任务上的性能堪比OpenAI o1模型正式版。

DeepSeek的成功,离不开其技术创新。DeepSeek摒弃了传统的监督微调路径,转而通过强化学习来优化推理路径。这一创新性的训练方法,率先在实验性R1-Zer版本上应用,随后又在DeepSeek-V3-base模型上得到验证。最终结果显示,DeepSeek系列模型在没有人工标注数据的情况下,通过不断尝试和反馈,展现出了持续的自我进化能力。DeepSeek还采用了创新的MoE-2048架构,使得模型参数的利用率大幅提升,训练效率相较于传统的Transformer架构提高了三倍。

DeepSeek大模型的能力已然有目共睹,更重要的是,它正在用创新性的低成本思路颠覆市场格局。以DeepSeek R1为例,其性能与GPT o1相当,但预训练成本仅为557.6万美元,仅为GPT-4o的十分之一。同时,DeepSeek API服务的定价也远低于OpenAI。DeepSeek的爆火,无疑给支持开源路线的人带来了信心。meta首席人工智能科学家Yann LeCun就表示,DeepSeek的成功代表了开源人工智能模型的胜利。

DeepSeek的崛起,不仅打破了AI大模型领域“拼算力”的逻辑,还动摇了投资者对高科技晶片的信心。多方的声音直接冲击了美国科技股的资本表现。这场由DeepSeek卷起的风暴仍在继续,从市场竞争格局来看,DeepSeek的崛起打破了原有的平衡,对传统的AI巨头构成了挑战,促使整个行业重新审视自身的技术路线和市场策略。

在DeepSeek横空出世之前,大多数人的目光还都集中在OpenAI以及一些科技巨头身上。没想到,DeepSeek的崛起让本就不平静的湖水再度泛起涟漪,也顺势引发了一系列的蝴蝶效应。OpenAI率先感受到了压力,不仅承认了闭源策略的错误,还迅速发布了o3-mini推理模型,并向所有用户开放了ChatGPT搜索功能。与此同时,OpenAI也在不断降低API调用价格,以应对DeepSeek带来的挑战。

DeepSeek的这只蝴蝶扇动翅膀的力度很大,不仅让OpenAI感到恐慌和跟随,还引发了更广泛的讨论和关注。然而,技术封锁并非保持优势的长期有效手段,开放与合作才更有利于AI行业的未来发展。以DeepSeek为代表的中国AI企业面临的挑战还有很多,但这场由DeepSeek掀起的新“ChatGPT”时刻,仍在继续书写着新的故事。

来源:ITBear科技资讯

相关推荐