DeepSeek的三发“震撼巨弹”,惊醒了全世界!

360影视 2025-01-31 11:08 2

摘要:2024年12月25日,这家不起眼的浙江小科技公司,在没有西方风险投资,更没攀附洋资本情况下,凭借对训练方法和模型架构的创新,仅用2048块GPU、只花557.6万美元,发布了DeepSeek-V3大模型,而成本只有老美谷歌、微软、甲骨文等科技巨头的2%。

这段时间,要说全世界最亮的星是谁?

无疑是DeepSeek,这家来自于中国杭州人工智能公司。

为什么说它全世界最亮?

因为它5天之内给了全世界带来“三发震撼巨弹”。

2024年12月25日,这家不起眼的浙江小科技公司,在没有西方风险投资,更没攀附洋资本情况下,凭借对训练方法和模型架构的创新,仅用2048块GPU、只花557.6万美元,发布了DeepSeek-V3大模型,而成本只有老美谷歌、微软、甲骨文等科技巨头的2%。

并且,它在MATH500、AIME2024和Codeforces三个维度更是遥遥领先,数学和编程能力极强,远超过GPT-4 和 Claude 3.5 Sonnet 这两大世界领先的闭源模型。

这一切,甚至也让科技巨头马斯克直接破防,他认为Deepseek-V3用这么少的GPU,花这点钱,是不可能做到的。

中国的大年三十,DeepSeek-R1发布,号称AI的“卖铲人”英伟达股价暴跌,盘中跌幅超过17%,单日的市值蒸发规模超过5000多亿美元,创2020年3月以来的最大跌幅,当时正值新冠疫情爆发初期,美股熔断之际。

纳斯达克综合指数跌3.07%,谷歌、微软、英特尔、台积电、博通公司、超微半导体等科技股也遭遇集体暴跌,股价大跌8%以上。

一天时间,华尔街股市市值蒸发3-4万亿美元。

老美的总统特朗普也表示, DeepSeek的崛起应当为美国企业敲响“警钟”,美国公司“需要专注于竞争以赢得胜利”。

Deepseek直接让鼓吹人工智能老美才最厉害,这个靠人工智能造富神话的骗局玩不下去了。

硬件媒体Tom's Hardware带来开年人工智能界最新的热议:“DeepSeek甚至绕过了CUDA,使用更底层的编程语言做优化。”

来自韩国的Mirae Asset Securities Research(未来资产证券)的分析称,DeepSeek-V3的硬件效率之所以能比Meta等高出10倍,可以总结为“他们从头开始重建了一切,变相绕过了硬件对通信速度的限制。”

CUDA可是英伟达GPU的生态护城河,要想使用英伟达的GPU,必须要用它的CUDA,如同微软和英特尔捆绑在一起类似。

一位亚马逊工程师就提出灵魂质问:CUDA是否还是护城河?这种顶尖实验室可以有效利用任何GPU。

据专业人士描述,DeepSeek脱离了CUDA生态的制约,同样代表他们也有优化其他GPU的能力。

事实上, DeekSeek已经与AMD、华为等团队紧密合作,第一时间提供了对其他硬件生态的支持。

DeepSeek让以后使用GPU的人工智能公司,不需依赖英伟达的CUDA,这也为华为、摩尔线程等中国国产GPU全面走向世界扫清了道路。

这让全世界看清每年销售额500亿美元,但股市市值却高达3.4万亿美元的英伟达底裤,这让它再怎么混?

下一步,老美凭借英伟达高端GPU来卡中国或其他国家的老套路失灵了。

声明:部分内容和图片来自网络,侵删。

最后,这期关于这期话题,大家还有哪些不一样的看法?欢迎评论区留言分享。

来源:中国男孩教育

相关推荐