摘要:东风吹雨过青山,柳絮飘摇水自闲。燕子归来寻旧垒,桃花落尽见新颜。人间万事皆如梦,世上千年只等闲。何日与君同把酒,共看明月照云间。这是DeepSeek给大家献上的一首《七律·春思》,看着看着,我的泪液漫过了泪湖。
农历新年将至,中国大模型DeepSeek发生了“顿悟”,似乎产生了灵魂,在这个蓝色星球上,不可思议的事情随时都在发生。
东风吹雨过青山,柳絮飘摇水自闲。燕子归来寻旧垒,桃花落尽见新颜。人间万事皆如梦,世上千年只等闲。何日与君同把酒,共看明月照云间。这是DeepSeek给大家献上的一首《七律·春思》,看着看着,我的泪液漫过了泪湖。
真正感动中国的,是DeepSeek背后的“作者”,一支不到140人的年轻团队,他们多是95后,来自北大、清华、中山、北邮的TOP高校,有的甚至在博士习生,没有高薪、没有资历、缺少经验,有的是对前沿科技的执迷探索和沉浸式追求。
DeepSeek的带队者,是85年出生的创始人梁文峰,一位数学建模爱好者,一个浙江大学人工智能毕业的怀揣梦想的年轻天才。不到两年,DeepSeek在AI大模型领域,用不到1/10的成本,做到90%以上的顶尖性能,干得美国AI科技巨头“哭的喊娘”。时逢中国新年,梁文峰现身《新闻联播》,向李强总理等国家领导人分享了全球科技未来趋势与变革的深度见解。
“来自东方的神秘力量”不断进化,现在版本是Deepseek-R1,通过“极致工程化 + 并行优化 + 精筛数据 + 精准后训练”为核心,来不断消减算力的“无效消耗”,把资源集中于核心模块的刀刃上,在有限的GPU资源下,训练结果逼近行业主流大模型的极限,这与美国科技大厂“烧钱喂养”的方式形成鲜明对比。
Deepseek-R1已经追平世界顶尖AI大模型,而且属于开源,物美价廉,DeepSeek应用在苹果中国区和美国区APP下载中,超越了AI大模型风向标ChatGPT排名第一,是上苍给中国AI界和全国人民的新年礼物,却是给美国AI界的重磅炸弹。
硅谷大佬们开始慌了,加班加点分析来自中国的“神秘力量”,因为他们花大价钱做出来的东西,可能面临被替代的风险。应用客户《自然》杂志在报道中说,一个OpenAI o1模型上需要花300英镑完成的工作,在DeepSeek R1上只需要不到10美元。
AI是整个美国科技革命的护城河,是美国“全村的希望”,现在有人告诉根基不稳:大模型优势不再了,算力芯片泡沫太大,就连特朗普刚刚牵头投资5000亿美元的“星际之门”也要开始“怀疑人生”。美国科技圈连同总统先生都在难过,这可是关系美国国运的大科技啊。
DeepSeek的火焰还没熄灭,从硅谷蔓延到应用客户,再蔓延到了华尔街资本市场。美国相关公司因涉及DeepSeek人工智能模型冲击,遭受了惨重的损失。
英伟达(NVIDIA)当日股价暴跌约17%,博通公司股价下跌17%,超威半导体公司(AMD)股价下跌6%,人工智能领域的衍生品,如电力供应商也受到重创,美国联合能源公司股价下跌21%,Vistra的股价下跌29%。随后欧洲及日本科技类股也集体暴跌。人们都在怀疑,一个成立不到两年的中国初创公司,怎么可能打得美西方“满地找牙”,但事情确实发生了。
DeepSeek引领的“低成本算力浪潮”已经让投资者们开始怀疑AI大厂“烧钱”干AI的合理性,如果没有让人满意的盈利和创收,未来的投资可能会大幅度减少。
在过去一段时间里,美国“七巨头”以超强的预期,让美国科技股一路长虹,甚至撬动了整个资本市场。在过去一周,几个大模型科技公司内部,紧张气氛让人窒息,工程师在忙着解读DeepSeek-R1的技术和影响,管理层在忙着考虑怎么化解项目带来得巨大成本对股东的不合理性。Meta公司内部员工自曝,DeepSeek-R1的进化可能让事情变得更为严峻。
“人怕出名,猪怕壮”,由于DeepSeek太火,影响太大,最新报道,DeepSeek官网服务状态页面显示,“近期DeepSeek线上服务受到大规模恶意攻击” ,出现了包括网页和API性能异常,无法登录或注册等问题,不过问题已很快得到解决。
由于DeepSeek太强,OpenAI都在寻求与之合作,有投资者称,“找他们的人踏破门槛了”,“最近几波我们去约都没约上”。记者加入了深度求索的“官方交流98群”。该群的群公告写道,“暂不对外进行项目合作,不提供私有化部署及相关支持服务。
尽管DeepSeek取得了辉煌的成绩,但梁文锋却保持了冷静的态度。对于DeepSeek爆火,他最新表示:“中国AI不可能永远跟随,我们需要在原创性上做出更多努力。”他表示,未来会继续大力研发和投入,目标是:真正实现通用人工智能。
2024第N种回顾方式#头条深一度#
来源:人猿宇宙