摘要:2月1日,就在OpenAI上新o3-mini推理模型同时,DeepSeek深度思考和联网搜索功能被爆暂时停止服务。一天之后,经字母榜(ID:wujicaijing)实测,目前DeepSeek深度思考服务已恢复正常,但联网搜索仍提示“由于技术原因,暂不可用”。
DeepSeek依然未能从服务崩溃中彻底走出来。
2月1日,就在OpenAI上新o3-mini推理模型同时,DeepSeek深度思考和联网搜索功能被爆暂时停止服务。一天之后,经字母榜(ID:wujicaijing)实测,目前DeepSeek深度思考服务已恢复正常,但联网搜索仍提示“由于技术原因,暂不可用”。
显然,借助春节期间产品更新而意外爆火的DeepSeek,已经越来越难以招架蜂拥而来的新增用户了。
Sensor Tower数据统计显示,DeepSeek移动应用上线仅18天便斩获1600万次下载,几乎是ChatGPT同期数据的两倍,目前更是在全球140个市场成为下载量最高的移动应用。
为了扩充算力基础设施,以满足更多用户的访问需求,“DeepSeek是时候找金主了。”某头部美元基金投资人陈明(化名)告诉字母榜,DeepSeek是罕见的尚未首轮融资,还以更低成本追平OpenAI的大模型企业,“包括美元基金,国内的投资方,如今都疯狂地寻找DeepSeek的联系方式。”陈明表示。
在陈明看来,投资人需要DeepSeek这个好故事,DeepSeek也不能只靠幻方量化的“零花钱”了。
就在DeepSeek爆火的档口,作为被追赶对象的OpenAI,还在烧钱的路上继续狂奔。继打造高达5000亿美元的星际之门计划后,近期,孙正义被爆再次加码。据《金融时报》报道,日本软银集团正在洽谈向OpenAI投资至多250亿美元(约合人民币1813亿元),这笔交易将使软银成为OpenAI最大金主。
对于立志想实现AGI(通用人工智能)的梁文锋而说,在进一步追赶OpenAI的路上,继续靠幻方量化一家的力量,无疑将变得捉襟见肘。
如何找到属于DeepSeek的微软和软银,或将是梁文锋在产品爆火之后,需要给DeepSeek敲定的下一阶段新叙事。
梁文锋也并非真的"不缺钱"。此前在36氪的采访中,梁文锋曾提及找过不同的投资方,但由于不少VC(风险投资)对研究有顾虑,有退出需求,希望尽快做出产品商业化,因此专注研究的DeepSeek很难从VC获得融资。
"DeepSeek 目前的卡点,一个是训练需要的数据,一个是卡(GPU),卡的背后是电力等等,尽管DeepSeek的性价比路线仍可持续,但仍然需要合作者。"某头部互联网大厂资深AI产品经理Bruce告诉字母榜。
如同OpenAI+微软的合作,对于DeepSeek来说,找个能在算力、数据上补足自身短板的合作者,DeepSeek便能更快地追赶上OpenAI的步伐。
毕竟,根据公开数据,华为海思最新昇腾910芯片,性能参数也只是英伟达H100的1/4,更和最新的B200有20倍的性能差。“穷有穷的玩法,但算力越丰富肯定越好。"Bruce说道。
除了蜂拥而至的全球新增用户对DeepSeek算力提出新需求之外,作为AGI必备前提的多模态之战,更需要DeepSeek提前储备好充足的算力资源。这也是奥特曼要斥资5000亿美元大搞算力基建的核心所在。
对现在只支持问答、读图、读文档的DeepSeek来说,未来随着大模型能力扩展到图片生成、音频生成和视频生成领域,其对算力和资金的需求都将呈指数级飙升。
趁着产品爆火的这股东风还在,想要填补资金缺口的DeepSeek,不妨尽早为自己选一选字母。
无论是老 BAT(百度,阿里,腾讯),还是字节这样的新贵,哪个“字母”,会是DeepSeek的“微软”呢?
A
"现在对DeepSeek来说,是融资最好的时候。"陈明告诉字母榜,他所在的创投圈子,过年转发朋友圈,10条有9条跟DeepSeek相关。猎头开出5-6倍的薪资求挖DeepSeek的员工已经是常规操作,如今的DeepSeek俨然是AI圈当红炸子鸡,再不存在前两年难从VC拿钱的问题。
从DeepSeek暴打硅谷,再到硅谷科技巨头"打不过就加入",在陈明看来,声名鹊起的DeepSeek已经有了自己的故事可讲。
在国外,DeepSeek拿到了越来越多的客户。
受DeepSeek影响一夜市值蒸发近6000亿美元的英伟达,已经在NVIDIA NIM正式搭载完整版DeepSeek-R1。同一天,亚马逊跟进。头部AI应用们,包括Perplexity,Cursor和Windsurf,也都在批量接入DeepSeek。
甚至,和OpenAI绑定,质疑DeepSeek“偷窃”数据的微软,抢在亚马逊、英伟达前面,率先把DeepSeek-R1部署在了云服务Azure上。
微软AI平台副总裁Asha Sharma在官网发文表示,DeepSeek-R1经过了严格的红队测试和安全评估,包括模型行为的自动评估和广泛的安全审查,以降低潜在风险。
在国内,登顶iOS应用榜第一并不足以概括DeepSeek热到发烫的现状。
回到农村老家过年的陈明,发现往年他提起AI投资一脸迷茫的亲戚,“已经开始和我聊DeepSeek了。”村头没读过小学的大妈,最近的抖音视频是为DeepSeek打call。
尽管热度空前,但需要注意的是,大模型企业的融资窗口期极短。这方面,月之暗面杨植麟深有体会。在腾讯科技的采访中,杨植麟提到在2023年2月,月之暗面集中做了首轮融资,"如果delay到4月,基本没机会了。"为了抢占大模型的创业窗口期,杨植麟甚至顾不得彻底解决与循环智能老股东的纠纷,毕竟"真正的窗口期就是1个月。"杨植麟说道。
对于梁文锋而言,抓住这波出圈机会尽快融资无疑是上选,毕竟国内外的竞争对手,已经等不及了。
OpenAI已经率先用o3-mini打响了反击DeepSeek的第一枪。软银正在洽谈的250亿美元最高融资,则是OpenAI继续保持自身优势的另一砝码。
图注:奥特曼表示或会开源OpenAI
图源:reddit平台
尽管性价比路线还可持续进行,但既要接住近期涌入的大批用户,又要继续追求AGI,梁文锋显然需要更多的钱,对齐OpenAI去拓展自己的算力基础设施。
B
“梁文锋缺的是数据,缺的是算力(卡)。”Bruce告诉字母榜,相比起如今大厂开发的大模型,DeepSeek出圈的正是低成本训练,而DeepSeek放弃Scaling Law(缩放定律,指训练大模型时,数据量、算力资源越多,训练出的模型效果越好)的原因,正是因为需要用最少的卡进行策略优化。
"即便是字节,各个组也在抢卡。"Bruce表示,不管是更多的卡,还是更高质量的卡,本质上算力越丰富,训练出的模型效果也会更好。
根据公开数据,以华为海思最新昇腾910芯片为例,性能参数与英伟达A100相近,是H100的1/4,但如果和英伟达最新的B200相比,存在大约20倍的性能差距。
可以说,对于背靠幻方量化的DeepSeek而言,眼下当务之急并非是找VC拿钱,单纯获得一笔财务融资,更重要的是找到能在数据和算力上补足DeepSeek短板的合作方,结成如同OpenAI+微软的联盟,寻找到自己的战略投资伙伴。
放眼国内,能在数据和算力上帮到DeepSeek的,恐怕非BAT们莫属。
在国内大模型行业发展两年之后,BAT们正取代VC,成为大模型赛道最有力的人民币玩家。
根据《金融时报》报道,2024年上半年,在AI相关领域,阿里支出高达230亿元,同比增长123%。腾讯支出也增至230亿元,同比增长176%,部分归因于对GPU和CPU服务器的积极投资。
除旧BAT外,浙商证券统计,2024年字节跳动在AI上的资本开支达到了800亿元,接近百度、阿里、腾讯的总和(约1000亿元)。
对梁文锋而言,不论是算力资源还是资金支持,BAT们都在成为其最理想的合作伙伴。
那么,梁文锋会挑哪一个字母进行合作呢?
"如果非要选一家,目前来看阿里可能性更高。"Bruce表示。
在DeepSeek之前出圈的AI六小龙(智谱、月之暗面、百川智能、零一万物、MiniMax、阶跃星辰)中,阿里几乎投了个遍。
同时,在DeepSeek急需的算力资源方面,阿里也有阿里云做支撑。
相比起来,同样有火山引擎云服务打底的字节,在大模型策略上更多选择自己做,而非投资。据腾讯科技报道,2023年中,字节跳动一度下场寻觅大模型标的,但在跟Minimax达成SPA(股份认购协议)的最后一刻,选择了放弃。
“如果字节和DeepSeek合作,内部团队的脸上也挂不住啊。”Bruce补充道。
对最早宣布入局AI的百度来说,也存在同样“重复造轮子”的问题。
至于腾讯,Bruce并不看好,“腾讯去年年初才开始发力AI应用,对大模型的热情似乎并不高。”
C
而实际上,不仅梁文锋需要挑一个字母做助力,BAT们与DeepSeek这样的大模型合作,也是各取所需。
对于腾讯而言,在这场大模型竞逐赛里,可以通过投资DeepSeek平衡自身的科技投资版图。毕竟,手握视频号、微信等重要场景,对大模型兴致缺缺的腾讯,也需要注意到来自AI的冲击。
不管是字节用豆包让创作者用AI写直播脚本、输出公众号,还是快手可灵强势切入视频创作者市场。甚至DeepSeek爆火后,社交平台上“用DeepSeek毒舌吐槽”爆火,长于推理和思考的DeepSeek凭借颇具“人味”的推理流程和输出,迅速成了最热的社交meme。
但腾讯在大模型研发上落后一步,至今尚未有出圈的AI产品。一旦和DeepSeek合作,对腾讯来说,智能创作的场景下无疑有了一张能打的新王牌。
百度和字节,尽管已经各自选择了自研大模型路线,并有了文小言、豆包等明星产品,但通过投资DeepSeek,无疑可以借助后者的超高人气,为自家云服务绑定一个超级大客户。
被Bruce认为合作可能性最高的阿里,对DeepSeek的需求强度同样也最高。
在将大模型战略重心转向To B后,阿里一度降低了对To C产品的重视力度。这也导致在过去一年,阿里大模型热度并不高。表现在产品侧,落后通义千问近半年上线的豆包,已经凭借近亿月活成为国内大模型应用榜一,同期通义千问APP的月活尚不足前者的1/10。
如果通过投资绑定DeepSeek这个当红炸子鸡,阿里便随即拥有了一款在声量和用户量上能匹敌其他大厂的防御武器。
同时,阿里云的先发优势也在AI时代被竞争对手步步逼近。IDC数据显示,2024年上半年的GenAI IaaS市场,阿里云市场份额跃居市场第一,但第二名火山引擎紧随其后。豆包等一系列产品的用户增长,助推字节火山引擎云服务规模快速扩展。
相比百度和字节,通过投资绑定DeepSeek这样一个云服务耗资大户,对阿里云的意义可能更大。
谁能接住DeepSeek这波泼天流量,就要看梁文锋的最终选择了。
来源:字母榜