摘要:前段时间,一个叫Deepseek的AI模型突然火遍全球,尤其是在美国更是一度登上App Store免费榜榜首。
本文内容均引用权威资料结合个人观点进行撰写,文末已标注文献来源及截图,请知悉。
Deepseek
文 | 科普10克
编辑 |科普10克
前段时间,一个叫Deepseek的AI模型突然火遍全球,尤其是在美国更是一度登上App Store免费榜榜首。
这家来自中国的AI公司仿佛一夜之间成了硅谷的宠儿,创始人梁文锋也一跃成为亿万富翁,那Deepseek到底有什么过人之处?
更令人惊讶的是就在Deepseek如日中天之际,它竟然被一位美籍华裔女科学家给复刻了,而且成本还不到50美元!
这究竟又是怎么做到的呢?
李飞飞
说起最近AI圈最火的事那非Deepseek莫属了,这家名不见经传的中国AI公司,春节期间在美国App Store上演了一出“教科书式”的逆袭好戏。
先是一鸣惊人,Deepseek的应用在1月27日一举登顶美区免费榜,力压群雄,同一时间还在国内App Store斩获第一。
要知道,这可是在TikTok缺席的情况下取得的成绩,从而展现了中国AI的惊人实力。
Deepseek仿佛一匹黑马,以迅雷不及掩耳之势闯入硅谷的视野,因此,它被誉为“来自东方的神秘力量”,掀起了一股中国AI热潮。
APP store
创始人梁文锋更是身价暴涨,一夜之间跻身亿万富豪行列。
那Deepseek到底有什么过人之处呢?原来,它推出了一个叫R1的AI模型,性能直追美国的GPT-3.5,但成本更低不说还是开源的,可以提供免费使用。
这在当时可以说是划时代的举措,让普通用户也能尝到顶级AI的甜头,与此同时,Deepseek的表现还着实亮眼,它获得了诸多业内大佬的赞誉。
比如a16z创始人、斯坦福教授吴恩达、微软CEO等都对其予以高度评价,一时间,Deepseek俨然成了硅谷的“宠儿”。
微软CEO纳德拉
不过,美国科技巨头们可就不淡定了,眼看一个中国AI后起之秀杀入自家地盘还抢走了用户,这滋味可不好受。
Meta等公司纷纷感受到了危机,不得不采取应对措施,专门成立团队来研究Deepseek的“独门秘籍”。
除此之外,美国政府还计划斥资3.6万亿美元建设AI基础设施,但Deepseek的横空出世,让这些动辄百亿千亿的投入显得有些“不值”。
图片来源于网路
毕竟,一个成本低廉的AI模型怎么看都更有性价比,不过今天要聊的主要话题可不是美国的应对措施,而是关于Deepseek被复刻成功的事情。
如今Deepseek风头正盛,而美国一位华裔女院士竟然只用了不到50美元的成本成功将其复刻下来,并且性能还不相上下。
她究竟是怎么做到的?
李飞飞
就在Deepseek风头正劲的时候,一个更劲爆的消息传来:Deepseek被人复刻了!而且还是被一位美籍华裔女科学家给复刻的。
这位女科学家不是别人,正是斯坦福大学计算机科学系的教授李飞飞。
李飞飞在AI领域可是大名鼎鼎,她领导的团队仅用了不到50美元的成本就复刻出了一个与Deepseek性能相当的AI模型,这个消息一出立马引起了业界的轰动。
很多人都好奇李飞飞团队是怎么做到的?原来,他们采用了一种叫做“test-time scaling”的方法。
图片来源于网路
这个方法通过构建一个精心挑选的小型数据集s1K,再用监督微调的方式对模型进行蒸馏,从而大幅降低了训练成本还提高了效率。
除此之外,团队还使用了一个叫“预算强制”的技术,通过控制模型的思考时间,比如强制它提前结束思考或者追加“等待”指令来延长思考,最终优化了模型的性能。
那s1模型的表现到底如何呢?
根据测试结果显示,它在数学竞赛题上的得分与Deepseek的R1模型不相上下,甚至跟谷歌的Gemini 2.0也不遑多让,由此可见,李飞飞团队的复刻可以说是相当成功了。
这不禁让人浮想联翩,如果Deepseek这样的顶级AI模型都能被轻松复刻,那是不是意味着我们每个人都有机会参与到AI模型的研发中来?
是不是意味着AI开发的门槛被大大降低了?
图片来源于网路
Deepseek的横空出世以及李飞飞团队的成功复刻,无疑给那些大型AI公司带来了不小的压力。
要知道,这些巨头们可是在AI领域深耕多年并且投入了大量的人力物力,好不容易建立起了自己的优势地位。
结果现在却被一个后起之秀和一个“娇小”的团队给威胁到了。
最直观的影响恐怕就是那些AI大佬们的身家了,在Deepseek的冲击下,以英伟达创始人黄仁勋为首的众多AI领域亿万富豪,财富都出现了大幅缩水。
英伟达创始人黄仁勋
黄仁勋一个人就蒸发了200多亿美元,这个数字着实吓人。
但真正让这些大公司担心的恐怕是自己多年的研发投入和技术积累,可能面临着前功尽弃的风险。
试想一下,如果像李飞飞团队这样几乎任何人都能轻松复制、超越你的顶级模型,那你之前的那些努力可能就白费了。
图片来源于网路
更何况Deepseek这样的开源模型,对于那些专注于应用AI的企业来说简直是一大利好。
它们完全可以直接拿来主义,用这些现成的模型去服务自己的业务,而无需再花大价钱去买大厂的模型使用权,这对那些靠卖模型赚钱的公司来说无疑是个不小的挑战。
面对这种情况,我们不禁要问:那些动辄投入百亿、千亿的AI基础设施项目,究竟还有没有必要?会不会成为一种“冤大头”的行为?
图片来源于网路
这个问题不好回答,从Deepseek和s1模型的案例来看,通过一些巧妙的技术手段的确可以以更低的成本去复现顶级模型,这似乎让那些大手笔的投资显得有些“不值”。
但另一方面我们也要看到,像Deepseek这样的开源模型虽然在推动AI普及上功不可没,但在真正突破AI性能上限方面恐怕还难有建树。
毕竟蒸馏技术再厉害也只是在已有模型的基础上做优化,而不是去创造一个全新的、更强大的模型。
从这个角度讲,那些大公司在AI基础设施上的投入还是很有必要的。
AI
只有掌握了足够强大的算力和数据资源才有可能去开发出革命性的新模型,去不断拓展AI的边界,这是任何一个对AI有野心的公司都绕不开的。
当然,这并不意味着大公司就可以一掷千金,毫无节制地烧钱。
正如Deepseek和s1所展示的,通过一些聪明的“偏方”是有可能在降低成本的同时,保证模型的性能表现的,这种“巧力”的思路值得那些大公司去借鉴和吸收。
现如今,在这场由Deepseek掀起的AI风暴中,我们似乎看到了一个新的时代在徐徐拉开帷幕,这个时代属于那些敢于挑战权威、勇于开拓创新的先行者。
Deepseek
Deepseek的崛起某种程度上代表了中国AI的崛起,作为一个后发国家,中国在AI领域起步较晚但发展速度惊人。
像Deepseek这样的公司正在用自己的实力向世界证明,中国AI已经不再是一个“跟跑者”,而是一个有能力参与全球竞争、贡献原创成果的“并跑者”。
与此同时,Deepseek的成功似乎也揭穿了美国AI的一些“遮羞布”。
多年来,美国一直以AI强国自居,他们动辄投入百亿、千亿巨资,大搞基础设施建设,但Deepseek的案例告诉我们真正优秀的AI模型,未必非要靠烧钱堆出来。
AI
通过一些巧妙的技术手段,通过对算法和架构的精心设计是有可能在降低成本的同时,实现同等甚至更优的性能表现。
这种“四两拨千斤”的思路,值得美国的科技巨头们好好反思。
可我们也要认识到,Deepseek的成功只是AI发展长河中的一个缩影,真正推动AI向前发展的还是那些不断突破边界、创造新模型的努力。
在这个方面,美国依然保持着领先优势。
Deepseek
Deepseek的故事从一个不起眼的中国AI公司到风靡全球的明星产品,再到被美籍华裔科学家以50美元成本复刻,可谓跌宕起伏且充满戏剧性。
人工智能的未来不会只是几家巨头的专属舞台,它属于所有敢于梦想、敢于创造的人,在这个万众创新的时代谁都有机会成为下一个引领风潮的弄潮儿。
这或许就是Deepseek给我们带来的最大启示。
人工智能
信息来源:
华尔街见闻:成本仅50美元,性能媲美Deepseek-R1,李飞飞带着S1来炸场了
华尔街见闻:DeepSeek真最强国产大杀器!一夜之间,1万亿美元市值、1000亿富豪身家“灰飞烟灭”
来源:科普10克