摘要:美国要被中国逼疯了!这回是AI界,在过去的一周里,美国人工智能行业所有公司都忙疯了!1月20日,一个来自中国杭州的DeepSeek-R1更新版开放AI大模型发布,令西方AI巨头们震惊的是这个训练费用只有300万美元的模型竟能执行OpenAI o1 相同级别的推
美国要被中国逼疯了!这回是AI界,在过去的一周里,美国人工智能行业所有公司都忙疯了!1月20日,一个来自中国杭州的DeepSeek-R1更新版开放AI大模型发布,令西方AI巨头们震惊的是这个训练费用只有300万美元的模型竟能执行OpenAI o1 相同级别的推理任务,并且开放供研究人员检查!
扎克伯格要求所有的AI工程师全员上阵24小时不间断分析大模型,OpenAI非常焦虑,这个能替代CHATGPT的到底是何方神圣!AI研究人员兼联合创始人埃尔维斯·萨拉维亚(Elvis Saravia)在X上写道“这是疯狂的,完全是出乎意料的!”
DeepSeek强势崛起:美科技界哀鸿遍野
1月20日,来自杭州的国内大模型深度求索(DeepSeek)公布了新一代开源大模型DeepSeek-R1,据发布公告给出的数据,该模型在数学、代码、自然语言推理等任务上,性能比肩美国OpenAI公司最新的o1大模型正式版。1月23日,Nature发表的标题为《China’s cheap, open AI model DeepSeek thrills scientists》文章确认,初步测试表明其在化学,数学和编码方面的某些任务的性能与O1的作用相当!
这直接就震惊了西方AI科技界,因为美国对中国实施了GPU算力封锁,英伟达只能向中国出售的芯片主要是H20,这是英伟达针对中国市场推出的特供版AI芯片,基于H100架构,但性能被大幅缩减,综合算力仅为H100的20%左右!
而AI模型训练需要天量算力,比如据2024年12月初的数据,微软、Meta、谷歌、亚马逊、xAI等世界五大科技公司算力总共约355万块等效H100,平均每家超过70万张!2024年底新晋AI巨头马斯克打算用10万张英伟达H100/H200显卡,并预计未来即将扩展到20万张。LessWrong网站统计了世界五大科技公司的2024年拥有的算力以及2025年的预测:
微软有75万-90万块等效H100,明年预计达到250万-310万
谷歌有100万-150万块等效H100,明年预计达到350万-420万
Meta有55万-65万块等效H100,明年预计达到190万-250万
亚马逊有25万-40万块等效H100,明年预计达到130万-160万
xAI有10万块等效H100,明年预计达到55万-100万
耗费的资金动辄数十亿美元!所以美国各大AI科技企业普遍预测,中国在AI技术方面普遍落后美国2~3年!看起来似乎并不落后,但是AI算力需求每3.5个月翻一番,相当于每年增长约10倍,2年是100倍!看起来差距并不是很大的数据瞬间被拉长至1%,一个可以忽略不计的比例!
但是DeepSeek发布的R1模型显然不是这个结果,这个仅仅使用了2048块英伟达H800 GPU进行训练、总成本约为 557.6万美元!也就是600万美元都不到就达到了各大AI巨头数十亿美元才能达到的效果!
CNBC在1月24日报道称,一个在2023年7月17日才成立,之前还是搞量化私募的外行成立的公司,用了2个月不到的时间,花了600万美元不到的资金就搞出来一个免费、开源的大型语言模型,在第三方基准测试中,DeepSeek的模型表现优于Meta的 Llama 3.1、OpenAI 的 GPT-4o 和 Anthropic 的 Claude Sonnet 3.5 的准确度范围从复杂问题的解决到数学和编码。
DeepSeek的发布在整个硅谷都引起了恐慌,美国在人工智能领域的全球领先地位是否正在萎缩,并让人对大型科技公司在构建人工智能模型和数据中心方面的巨额支出提出质疑!微软CEO萨蒂亚·纳德拉 (Satya Nadella) 周三在瑞士达沃斯举行的经济论坛世界人工智能大会上表示:
“看到DeepSeek新模型,令人印象深刻的是他们如何真正有效地完成了一个开源模型,该模型可以进行推理时间计算,并且具有超级计算效率。” “我们应该非常非常认真地对待中国的事态发展。”
外界普遍在猜测DeepSeek的R1模型为何效率那么高,CNBC就认为DeepSeek 要么找到了绕过规则的方法,要么表明出口管制并不是华盛顿想要的遏制。Benchmark普通合伙人Chetan Puttagunta则表示,DeepSeek的大模型效率令人印象深刻,但他们可能使用了作弊的方式:
“他们可以采用一个非常好的大型模型,并使用一种称为蒸馏的过程。” “基本上,你使用一个非常大的模型来帮助你的小模型在你希望它变得聪明的事情上变得聪明。这实际上非常具有成本效益。”
什么意思呢?大意就是污蔑DeepSeek可能使用了其他模型的学习库,就像是站在了巨人的肩膀上,但问题是西方这些模型库都是保密的,用了数十亿美元猜学习到的库就能轻易示人?
《纽约时报》则报道称,“与谷歌和 OpenAI 等美国巨头相比,该公司使用更少的高端计算机芯片构建了更便宜、有竞争力的大语言模型,显示了芯片出口管制完全没有限制中国AI技术的发展” DeepSeek正在与硅谷巨头进入了白热化竞争。”
除了CNBC和《纽约时报》外,CNN以及BBC和路透社等都进行了报道,态度几乎都是一致的,无不惊讶于DeepSeek用如此少的资源(大约只有1%~10%的资金)就能完成如此大型任务!相比之下META开发成本超过10亿美元,而典型的大语言模型至少需要16000块芯片才能完成任务!
专注于人工智能技术的风险投资公司 Page One Ventures 的投资者克里斯·V·尼科尔森 (Chris V. Nicholson) 表示:“拥有600万美元可供支出的公司数量远远多于拥有1亿美元或10亿美元可供支出的公司数量。”言下之意是DeepSeek已经将西方一直包装成高大上的AI狠狠的拉低到了几乎平民的化的时代!
相对于西方媒体的震惊:各大AI巨头则是恐慌
媒体只是一个局外观察者,但各大AI巨头则是当事人,毫无疑问DeepSeek已经引发了他们恐慌!一个只用了他们1%~5%的资金,10%的算力资源、2个月的不到的时间就完成了一个媲美于全球最牛逼的OpenAI和Meta的LLaMA模型!
据The Decoder的一篇报道称,Meta的人工智能部门正感受到了空前的压力。Meta“处于恐慌状态,扎克伯格指示工程师们正疯狂地剖析DeepSeek,并从中复制我们所能复制的任何东西。”
OpenAI的CEO奥特曼也发文肯定了DeepSeek,只是奥特曼的说法怎么都觉得有点别扭,他表示随意发布开源高性能AI模型可能带来安全和滥用风险,强调需要谨慎对待此类技术的开放性。这个意思是说就只能美国搞不许中国搞?另外一位硅谷的大牛卡帕西(Andrej Karpathy)也对DeepSeek赞叹不已,他倒是表示肯定的意见。
现在各大AI巨头面临最大的问题是如何向AI投资者解释,动辄数十亿美元的投资都去哪里了,为什么中国人用10%的硬件、5%都不到的资金却能干出西方数十亿美元才能完成的大语言模型?这只是第一个问题而已!
而第二个问题面临的则是用户被抢,现在的DeepSeek已经遭到了“挤兑”,早在V3发布的时候种花家就已经注册了DeepSeek,测试几次之后发现很好用啊,CHATGPT4.0的在线搜索功能是要付费的,3.5里有免费次数但每天免费次数非常有限,DeepSeek完全免费,现在当搜索引擎不要太好用。不过近几天来使用DeepSeek时偶尔会是用户太多:
一个可能是用户真的太多了,原来需要收费或者曲里拐弯用的CHATGPT已经免费用了,你说用户能不被抢跑吗?而且DEESEEK还面向商业用户,价格非常亲民:
DeepSeek-V3:输入 0.1-2元/百万 tokens,输出 2-8元/百万 tokens。
DeepSeek-R1:输入 1-4元/百万 tokens,输出 16元/百万 tokens。
DeepSeek-Chat:输入 0.1-1元/百万 tokens,输出 2元/百万 tokens。
相比较而言,OpenAI公司最新的o1大模型百万token输出需要60美元(约合人民币436元),单价只有3%不到,就跟不要钱一样,这个绝对能逼疯这些美国这些AI大模型
DEESEEK到底是怎么做到的?
这个注册才一年半不到的公司竟然搞出了与OpenAI媲美的大语言模型,OpenAI前政策主管、Anthropic联合创始人Jack Clark认为DeepSeek雇用了“一批高深莫测的奇才”,但是DEEPSEEK的创始人、头部量化私募幻方量化的创始人梁文峰表示:
并没有什么高深莫测的奇才,都是来自Top高校的毕业生、没毕业的博四、博五实习生,还有一些毕业才几年的年轻人。
不过梁文峰并没有进一步透露DEEPSEEK的技术细节,到目前为止DEEPSEEK对外界依然是一个黑箱,并且DeepSeek从成立进军通用人工智能领域,至今从未对外融资!
这个结果美国做梦都没想到:六代机、文化霸权、AI科技神话一夜之间崩溃
很多网友都在猜测,DEEPSEEK强势崛起,哪几家AI巨头会倒霉?微软、Meta、谷歌、亚马逊、还是新晋巨佬马斯克的xAI?无疑会受到直接冲击,除了用户影响,第二个就是投资者,因为后续模型的训练投资需要数十亿美元乃至更多的投资!
比如OpenAI 的下一代大型语言模型 GPT-5(代号“Orion”)的开发遇到了多重挑战,导致项目进展延迟,主要原因就是GPT-5的训练成本超过10亿美元,马斯克的xAI则投资超过50亿美元,并且宣布将数据中心内的GPU数量从10万个增加到20万个,以加速AI模型的训练过程。结果DEEPSEEK的用他们5%的资源就干完了,请问如果你是投资者,会不会怀疑这帮孙子在黑你的钱?
第一个倒霉的无疑就是这些AI巨头,第二个倒霉的是谁?肯定是英伟达!原因很简单,因为一旦DEEPSEEK的算力革命成功,更少的算力即可维持更大模型的学习,目前的微软、Meta、谷歌、亚马逊和xAI的算力已经足够支撑AI学习5年以上,那么问题来了,这些公司是不是算力过剩,英伟达未来向谁出货?如果AI的算力需求突然消失,并且连续几年都不需要购买新的算力,你猜结果会如何?最后英伟达也会走向破产,黄仁勋将会跪在中国人面前,求我们买他的显卡!
那么第三个倒霉的是谁?华尔街的投资者乃至整个美国!1月21日,新任美国总统特朗普在白宫举行的一场发布会上,宣布了一项名为“Stargate”(星际之门)的人工智能(AI)基础设施投资项目,软银集团创始人、董事长兼总裁孙正义表示将投资5000亿美元。“星际之门”的初始股权投资人包括软银、OpenAI、甲骨文和技术投资公司MGX。
事实上软银并不可能真的投资5000亿美元,截至2024年9月底,软银的现金及现金等价物约为3.8万亿日元(约250亿美元),加上芯片设计公司Arm约90%的股份,按当前市值计算,这部分持股价值约为1600亿美元,也就是说2000亿美元都不到,这软银就是来骗鬼的!
“星际之门”计划的本意就是希望撬动更多的资金投资美国的AI产业,但从OpenAI的大语言模型CHATGTP发布以来,硅谷以及华尔街的金融大佬们已经向AI产业总共投入了千亿级美元的规模,到2025年可能会超过2000亿美元,但到现在为止这个2000亿美元的回报率可能连1%都不到,如此巨大的规模有两个出路,一个是找到变现机会,也就是将AI变成生产力!
这个方面中国做的最好,因为中国的在生产制造以及消费电子等多个方面都能消化掉这些专业AI模型的技术能力,而美国不行,并且美国走的是通用模型,要将通用的大语言模型转变成生产力很难,尽管目前有基于这些模型的各种工具,但投入回报比完全不成比例!
另一个就是寻找接盘侠!所以种花家认为特朗普宣布的这个为“Stargate”(星际之门)的人工智能(AI)基础设施投资就是来骗钱的,等到撬动社会资金投入时这帮人就抽身走了,留下一地鸡毛!各位有没有发现一个问题,特朗普这次回来就是来割韭菜的!2025年1月17日,特朗普在宣誓就任美国总统前三天宣布推出特朗普币,总共10亿枚,目前发行2亿枚,目前特朗普账面收益高达573.2亿美元,身价暴涨10倍!
请问各位,这2000亿美元的AI产业,未来几千亿美元的特朗普币,甚至他老婆还发行了梅尼拉币,以后搞不好还有巴伦币、伊万卡币.......这些是不是泡沫?AI产业的泡沫已经被DEEPSEEK戳破了,中国用美国的零头就搞出了一个和美国天量资金才搞出来的模型,这2000亿美元也就值个20亿美元;特朗普币倒是要等到他下台那刻才会破灭,不过这有啥关系,特朗普家族已经挣到钱了。
DEEPSEEK就是科技界的六代机,与去年12月26日公开的中国六代机一样,对美国科技的冲击相当大,不亚于一场大地震!之后就是社交媒体上的中美网友大对账,人家发现中国人的生活没那么差,美国人的生活也没那么好,美国梦碎了!美国网友却在向往中国人的生活方式!2025应该是属于中国的元年!无论从军事还是文化话语权以及科技神话,美国已经被中国挑落马下,有网友推测,只要再过10年中国就将彻底取代美国!
#深度好文奖励计划#
来源:星辰大海的种花家