DeepSeek的三发“震撼巨弹”，惊醒了全世界！

摘要：2024年12月25日，这家不起眼的浙江小科技公司，在没有西方风险投资，更没攀附洋资本情况下，凭借对训练方法和模型架构的创新，仅用2048块GPU、只花557.6万美元，发布了DeepSeek-V3大模型，而成本只有老美谷歌、微软、甲骨文等科技巨头的2%。

这段时间，要说全世界最亮的星是谁？

无疑是DeepSeek，这家来自于中国杭州人工智能公司。

为什么说它全世界最亮？

因为它5天之内给了全世界带来“三发震撼巨弹”。

2024年12月25日，这家不起眼的浙江小科技公司，在没有西方风险投资，更没攀附洋资本情况下，凭借对训练方法和模型架构的创新，仅用2048块GPU、只花557.6万美元，发布了DeepSeek-V3大模型，而成本只有老美谷歌、微软、甲骨文等科技巨头的2%。

并且，它在MATH500、AIME2024和Codeforces三个维度更是遥遥领先，数学和编程能力极强，远超过GPT-4 和 Claude 3.5 Sonnet 这两大世界领先的闭源模型。

这一切，甚至也让科技巨头马斯克直接破防，他认为Deepseek-V3用这么少的GPU，花这点钱，是不可能做到的。

中国的大年三十，DeepSeek-R1发布，号称AI的“卖铲人”英伟达股价暴跌，盘中跌幅超过17%，单日的市值蒸发规模超过5000多亿美元，创2020年3月以来的最大跌幅，当时正值新冠疫情爆发初期，美股熔断之际。

纳斯达克综合指数跌3.07%，谷歌、微软、英特尔、台积电、博通公司、超微半导体等科技股也遭遇集体暴跌，股价大跌8%以上。

一天时间，华尔街股市市值蒸发3-4万亿美元。

老美的总统特朗普也表示， DeepSeek的崛起应当为美国企业敲响“警钟”，美国公司“需要专注于竞争以赢得胜利”。

Deepseek直接让鼓吹人工智能老美才最厉害，这个靠人工智能造富神话的骗局玩不下去了。

硬件媒体Tom's Hardware带来开年人工智能界最新的热议：“DeepSeek甚至绕过了CUDA，使用更底层的编程语言做优化。”

来自韩国的Mirae Asset Securities Research（未来资产证券）的分析称，DeepSeek-V3的硬件效率之所以能比Meta等高出10倍，可以总结为“他们从头开始重建了一切，变相绕过了硬件对通信速度的限制。”

CUDA可是英伟达GPU的生态护城河，要想使用英伟达的GPU，必须要用它的CUDA，如同微软和英特尔捆绑在一起类似。

一位亚马逊工程师就提出灵魂质问：CUDA是否还是护城河？这种顶尖实验室可以有效利用任何GPU。

据专业人士描述，DeepSeek脱离了CUDA生态的制约，同样代表他们也有优化其他GPU的能力。

事实上， DeekSeek已经与AMD、华为等团队紧密合作，第一时间提供了对其他硬件生态的支持。

DeepSeek让以后使用GPU的人工智能公司，不需依赖英伟达的CUDA，这也为华为、摩尔线程等中国国产GPU全面走向世界扫清了道路。

这让全世界看清每年销售额500亿美元，但股市市值却高达3.4万亿美元的英伟达底裤，这让它再怎么混？

下一步，老美凭借英伟达高端GPU来卡中国或其他国家的老套路失灵了。

声明：部分内容和图片来自网络，侵删。

最后，这期关于这期话题，大家还有哪些不一样的看法？欢迎评论区留言分享。

来源：中国男孩教育

标签：震撼 deepseek cuda

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!