摘要:最近,网上流传着这样一个梗:“2022年ChatGPT将在未来取代很多人的工作;2023年ChatGPT将在未来取代很多人的工作;2024年ChatGPT将在未来取代很多人的工作;2025年DeepSeek取代了ChatGPT的工作。”
最近,网上流传着这样一个梗:“2022年ChatGPT将在未来取代很多人的工作;2023年ChatGPT将在未来取代很多人的工作;2024年ChatGPT将在未来取代很多人的工作;2025年DeepSeek取代了ChatGPT的工作。”
事实或许正像梗里说的那样,DeepSeek火爆出圈,在2025年的春节期间持续发酵,几乎一夜之间就火遍全球、世人尽知。
这种场景,犹如回到了两年前。
2023年春节期间,ChatGPT火爆出圈。它是美国AI公司Open AI发布的基于大语言模型GPT-3.5的AI聊天机器人程序。在上线初期,Open AI没有进行大规模的宣传,却在短短两个月内,月活用户突破1亿,成为史上用户增长速度最快的消费级应用程序。《纽约时报》称其为“有史以来向公众发布的最佳人工智能聊天机器人”;微软联合创始人比尔・盖茨也公开表示,ChatGPT的诞生有着重大历史意义,不亚于互联网或个人电脑的诞生。
在国内,自2023年3月份GPT-4上线后,国内科技企业纷纷跑步入场,开启“百模大战”:百度“文心一言”、阿里巴巴“通义千问”、华为“盘古”、360“智脑”等大模型先后登场。除通用大模型外,不少企业也推出了深耕行业、具有专业能力的垂直大模型,例如携程的旅游行业大模型“携程问道”,网易有道发布基于教育的大模型“子曰”等;此外,清华、复旦、中科院等高校与科研院所也在大模型领域深度布局。
2024年一开局,“大模型六小虎”(智谱、Minimax、月之暗面、零一万物、阶跃星辰、百川智能)顺势而生,它们以各自的技术特点和优势,尤其是暴涨的估值,一度成为国内科技圈及商业界的“现象级创业天团”,持久“霸屏”。
然而,在天使投资人曾良看来,在2024年被热议的“Kimi们”都只能称之为“小火花”,“与ChatGPT和DeepSeek相比,还不在一个量级上。”他对未来图灵表示,“六小虎”在技术实力、市场影响力等方面,与头部的AI产品仍存在差距。
“现象级公司”:DeepSeek
有业内人士分析指出,DeepSeek的爆火与2023年ChatGPT的走红有着诸多相似之处。
二者均在春节长假期间于海内外迅速发酵,引发全球关注。2023年,ChatGPT一经推出便刺激中美市场AI软硬件方向全面爆发;而在2025年,DeepSeek的崛起则导致美股硬件端大跌,A股市场英伟达产业链受挫,不过,与此同时,中美市场的AI应用及软件方向却迎来大幅上涨,呈现出此消彼长的独特态势。
在资本层面,ChatGPT与DeepSeek都引发了各路资金的共振。无论是机构投资者、游资,还是广大散户,都积极参与到AI板块的投资中。近期,金山办公、三六零、用友网络、金蝶、海光信息、中科曙光、科大讯飞、浪潮信息等中大市值股票纷纷大涨。
并且,在市场疲弱之际,ChatGPT、DeepSeek都能挺身而出。2023年2月-7月市场调整时,AI方向成为稳定市场、引领市场的关键力量;如今,在当前市场调整阶段,端侧AI和AI应用再次因DeepSeek的出现而爆发。
DeepSeek成立于2023年7月17日,自成立以来,便专注于先进大语言模型及相关技术的开发,在硅谷,它很早就被称作“来自东方的神秘力量”。2024年底,DeepSeek发布新一代大语言模型V3,而2025年1月20日,DeepSeek发布其最新开源模型R1,再次引发全球人工智能领域关注。R1模型在技术上实现了重要突破——用纯深度学习的方法让AI自发涌现出推理能力。
产品发布后,DeepSeek在全球范围内迅速走红。在中国区和美国区苹果AppStore免费榜中,DeepSeek均位列首位,超越了包括ChatGPT在内的多个知名AI产品。其不仅能够理解并准确回答各类问题,还能辅助写代码、整理资料以及解决复杂的数学问题,被网友亲切地称为“全能型AI助手”。与Open AI开发的ChatGPT相比,DeepSeek率先实现了媲美Open AI-o1模型的效果,还将推理模型的成本大幅降低。新模型DeepSeek-R1仅以十分之一的成本就达到了GPT-o1级别的表现,设计成本更是不到600万美元,海内外AI圈称之为“小力出奇迹”。
目前,DeepSeek已获得国内外云巨头的大力支持。阿里云、百度智能云、华为云、腾讯云国内四大云巨头都已正式支持DeepSeek,此前,海外的亚马逊AWS、微软Azure等云巨头也已官宣支持。不少大厂员工在社交媒体上表示,春节假期都在为DeepSeek公司加班。不仅如此,英伟达市值蒸发创纪录、DeepSeek卡顿、榜单第一……与DeepSeek直接间接相关的新闻,在春节期间不断刷新。
中信建投称,DeepSeek激活创新竞争,AI应用迎来“安卓时刻”;华西证券将DeepSeek的出现,视为国产AI应用的“诺曼底时刻”。
Deepseek推动AI实现“平民化”
如果说2023年爆火的ChatGPT是让大家普遍认识到了AI的可用性,那么2025爆火的Deepseek则有望推动AI实现“平民化”。
业内人士称,DeepSeek搅动了全球AI的“一池春水”,其颠覆性在于实现AI平权,并且重估资产价值。
DeepSeek基于开源AI系统,为更多开发者创造了开发实用AI应用场景的机会,让AI能够真正走进普通人的生活。AI开源初创公司Hug-gingFace联合创始人、首席科学家ThomasWolf在日前的公开活动上谈论到DeepSeek时表示,人工智能的下一步将是“应用”。“很多模型已经开源并且向用户免费提供,”他说,“下一步将是如何在这些模型之上建立应用,让模型在应用层面变得有用,从而能完成现实中的任务,让每个人能在生活中受益。”他还表示,很多时候人们并不需要一个能够解决最前沿数学问题的大模型。“大部分的现实场景应用不需要那么高级别的智商,这些应用是很容易建立起来的。”
DeepSeek采用无人为干预的强化学习方式,这是其独特核心。以训练DeepSeek-R1-Zero基础模型为例,训练中模型能自行摸索出类似人类解题的方法,自行涌现推理能力,和其他模型有着本质区别,此前只有Open AI有推理模型且对其推理方式保密,而DeepSeek不但探索出此路径,还公开了推理模型的秘密。在训练成本上,DeepSeek优势极大,其R1的预训练费用仅557.6万美元,使用约2000个英伟达专用芯片就完成训练;相比之下,Open AI训练ChatGPT-4o花费高达7800万美元甚至1亿美元,且需要上万张GPU芯片。科研人才投入方面,DeepSeek团队仅约140研发人员,Open AI团队则有1200名研究人员。同时,DeepSeek API定价也极具性价比,收费大约是Open AIo1运行成本的三十分之一,被称为AI界的“拼多多”。
DeepSeek还支持模型蒸馏,能将推理能力迁移到更小型的模型中,经R1蒸馏的小模型推理能力显著提升。并且,DeepSeek基于前代MLA+MOE架构训练,降低训练成本,遵循MIT License开源协议,允许用户自由使用、修改和商用,还开源了R1-Zero和多个蒸馏后的小模型。
清华大学长聘副教授刘知远日前在参与由中国计算机学会青年计算机科技论坛策划的直播活动时表示,“DeepSeekR1的开源,让全球的人能够意识到深度思考的能力。这相当于让整个人工智能领域再次迎来了类似于2023年初ChatGPT的时刻,让每个人感受到大模型的能力又往前迈进了一大步。”刘认为,DeepSeekV3展示了如何用十分之一甚至更少的成本完成达到GPT-4和GPT-4o水平的能力,此外DeepSeekR1的出圈也证明了Open AI犯了“傲慢之罪”——它不开源,不公开技术细节,且定价过高。
DeepSeek影响投资风向?
DeepSeek的崛起,还显著影响了AI投资风向。
2024年初,朱啸虎在谈及中国大模型创业公司时曾表示:“我们一看就知道,这个肯定没戏”“我们一开始就说了,我就不看好大模型!”他认为大模型创业面临诸多困境,比如融资难、商业化路径不明等问题。在当时,他秉持着现实主义的投资理念,认为创业者应更多关注商业模式的落地与商业化的可能性,而不是盲目投入大模型的研发。
到了2024年底,他对于AGI的态度依旧冷淡,认为在当时的AI架构上根本不可能实现AGI,直言“今天还忽悠AGI的人都是有自己另外想法的”。在他看来,AGI更多是一种遥远的理想,而非当下能够实现的现实。
事实上,月之暗面(kimi)从高光时刻的跌落,也与朱啸虎不无关系。(参见未来图灵文章:月之暗面“交恶”投资人揭秘:成败张予彤?)
然而,2025年春节期间,DeepSeek的异军突起彻底改变了朱啸虎的看法。他在接受腾讯科技的访谈时,毫不吝啬对DeepSeek的赞美之词,用“真的让我大开眼界”“非常惊艳”“非常惊讶”“很吃惊”“哇!”等话语来表达内心的震撼。他反复强调DeepSeek与自己交互时的体验,用“太优美了”“非常有深度”来评价,这两个词他总共强调了16遍。
朱啸虎甚至对腾讯科技表示,DeepSeek快让他相信AGI了。他认为DeepSeek证明了一条实现AGI的可能路径,而且实现成本相对较低。
朱啸虎态度的转变,在一定程度上反映了AI投资风向的转变。此前,投资者对于大模型创业公司普遍持谨慎态度,关注重点在于商业模式的可行性和商业化的前景。
英诺天使基金合伙人、北京市前沿国际人工智能研究院理事长王晟曾表示,“2023年没投大模型的投资人很焦虑,而2024年投了大模型的投资人更焦虑。”他认为,大模型企业耗资大,落地场景和赚钱能力未被证明,AI能力有提升空间,导致后续融资有较大不确定性。
而一位匿名投资人曾在2024年对科创板日报预测称,2025年大模型及相关企业融资难度或较大。另外能接盘的资本也非常有限,“大模型企业可能更多寻求中东等国外资本,但实际融资金额和宣传可能存在差异,比如,国资可能会有相应的一些产业落地要求等,如果达不到后期打款或许会设限。”
此次DeepSeek的成功,是否会让投资者开始重新审视对大模型创业公司的投资策略?
DeepSeek冲击下,“六小虎”如何自处?
据非凡产研数据显示,截至1月31日,DeepSeek移动端DAU(日活跃用户)已突破2570万,相当于同日ChatGPT移动端日活数量的50.23%。在PC端,DeepSeek表现同样强劲,1月28日,其官网(chat.deepseek.com)单日活跃用户飙升至2477万,达到ChatGPT官网(chatgpt.com)同期日活的33.26%。
自2025年1月11日至1月31日,DeepSeek全平台(WEB端+APP端)日活跃用户数从124万上涨到峰值的4541万,累计增幅高达36.6倍,并于1月24日超过月之暗面旗下AI应用Kimi,1月27日超过字节跳动旗下AI应用豆包,成为全平台日活排名全球第二大AI应用。
DeepSeek飞涨的速度让人望尘莫及,自2025年1月11日至1月31日,DeepSeek移动端下载量迅速飙升至峰值的1104万,刷新全球AI应用单日下载量纪录,当月累计下载量4592万次,而同期ChatGPT移动端累计下载量为3489万。
2月6日,Google发布Gemini 2.0,各家都在报道剑指的就是DeepSeek,这在之前是不可想象的。许多业内人士表示,这直接将DeepSeek拉到了跟Open AI、Gemini齐平的水平线上。他们认为,夸张点说,DeepSeek甚至可能会终结国内的“百模大战”。
有业内人士对未来图灵表示,“大模型六小虎”的出现是由于在ChatGPT冲击下,中国市场衍生的“中国大模型”,而如今DeepSeek的崛起,会让这些原有的公司越来越难受,甚至需转型。
2024年“大模型六小虎”还风光无限。据此前公开资料统计,“六小虎”2024年均获得了亿元级融资,大模型项目在一级市场吸金超过200亿元。其中,智谱、月之暗面、百川智能估值已超200亿元。“吸金”能力最强的是2024年底深陷仲裁风波的月之暗面。2024年初,阿里投资月之暗面近8亿美元,随后的8月,月之暗面再度收获大额融资,跻身估值超200亿元的国产大模型独角兽之列。如今,旧秩序被打破,新规则尚未建立。Gartner分析师Chirag Dekate认为:“DeepSeek并未戳破AI泡沫,反而为其注入新增长动力。”
随着DeepSeek热度飙升,联想、钉钉等科技巨头推出基于其大模型的一体机解决方案,华为也宣布全面支持DeepSeek大模型本地部署。财信证券称,DeepSeek或许正在重塑AI产业格局 ,中国AI科技股未来可期。
或许,这也正是所有人乐见的。最近,零一万物首席执行官、创新工场董事长李开复博士在接受《人民日报》英文客户端专访时,就如此表示:“两年前ChatGPT问世时,中国可能落后了七年左右的时间。但在过去两年中,中国已经在快速学习并开发出了很多非常优质的大语言模型,模型性能非常接近美国顶尖模型,也许还比不上最好的模型,但已经相当接近。与此同时,中国模型的效率要高得多。”
来源:新浪财经