DeepSeek登顶应用商店,Nvidia市值蒸发近6000亿,AI竞赛再起波澜?

360影视 2025-01-28 13:38 2

摘要:周一,美国股市上,英伟达公司的股价遭遇了自2020年3月16日以来最糟糕的一天,收盘时大幅下跌约16.9%。伴随股价的暴跌,英伟达公司的市值蒸发了近600亿美元,打破了这家人工智能(AI)芯片巨头去年9月创下的美股上市公司市值单日跌幅最大纪录。

周一,美国股市上,英伟达公司的股价遭遇了自2020年3月16日以来最糟糕的一天,收盘时大幅下跌约16.9%。伴随股价的暴跌,英伟达公司的市值蒸发了近600亿美元,打破了这家人工智能(AI)芯片巨头去年9月创下的美股上市公司市值单日跌幅最大纪录。

此次美国AI相关股票的暴跌,源自一家名为DeepSeek的中国AI初创公司的冲击。本周末,DeepSeek的应用程序在各大应用商店中异军突起,成功将OpenAI的ChatGPT从苹果App Store美国区最热门免费应用榜榜首拉下马来。据移动应用分析公司Appfigures的数据,周一,在iOS平台上,DeepSeek不仅在美国App Store位居榜首,还在全球其他51个国家的应用商店免费应用榜上登顶。

DeepSeek在美国社交媒体平台X上上周末的AI模型爆火后,其在应用商店的排名也随之飙升。令人惊讶的是,DeepSeek训练其V3大型语言模型(LLM)仅耗资558万美元。该公司声称使用了2048个英伟达H800芯片,这是英伟达H100芯片的降级版本,旨在遵守美国的出口限制。DeepSeek仅用260万H800小时就训练出了一个远超meta模型效果的模型,而meta使用其Llama 3模型家族的预算,本可以至少训练出15个DeepSeek-V3。

本月早些时候,DeepSeek发布了其开源的DeepSeek-R1推理模型,声称其性能可与OpenAI的o1等领先产品相媲美,但成本却低得多。多个第三方测试发现,DeepSeek的表现实际上超过了OpenAI的最新模型。R1包含671亿个参数,其“精简”版本的大小从15亿个参数到70亿个参数不等。通过DeepSeek的API,完整版本的R1可以以比o1便宜90%-95%的价格获得。

知名投资人马克·安德森周五在X平台上表示,DeepSeek的推理模型是“我见过的最惊人、最令人印象深刻的突破之一,作为开源产品,它是对世界的一份深刻礼物”。安德森是硅谷有影响力的风险投资公司Andreessen Horowitz的掌门人,他将R1比作“AI领域的斯普特尼克时刻”,指的是1957年苏联发射第一颗人造地球卫星,从而拉开了太空竞赛的序幕。

Hugging Face平台上的开发者已经创建了500多个R1衍生模型,这些模型的总下载量已达到250万次,是官方R1下载量的五倍,该平台CEO克莱姆·德朗格在X上的一篇帖子中说道。

英伟达的一位发言人表示,DeepSeek是“一项优秀的人工智能进步”。这位发言人在周一接受CNBC采访时表示:“DeepSeek的工作展示了如何使用这种技术创建新模型,利用广泛可用的模型和完全符合出口管制要求的计算能力。”

路透社援引英伟达方面的评论称,DeepSeek的推理需要大量英伟达图形处理单元(GPU)和高性能网络的支持。该公司还强调,DeepSeek使用的是为中国市场设计的获批GPU版本,以此来反驳有关潜在出口违规的指控。

经纪公司杰富瑞评论称,DeepSeek在AI训练方面的能力,对上周Stargate和meta做出的重大承诺后引发的资本支出狂热造成了一定程度的打击。鉴于DeepSeek的性能可与GPT-4o相媲美,但计算能力却低得多,杰富瑞认为,这可能对AI领域的企业造成潜在的负面影响,因为AI企业面临着证明其不断增长的资本支出计划合理性的压力,这最终可能导致数据中心收入和利润增长的轨迹降低。

然而,花旗集团对这一观点提出了质疑,认为DeepSeek的成就并非没有使用先进的GPU进行微调或构建其最终模型所基于的基础LLM,并通过蒸馏技术来实现。花旗集团预计,领先的AI公司不会放弃使用更先进的GPU,因为这些GPU在规模上提供了更具吸引力的美元/TFLOPs(万亿次浮点运算)性能。

来源:ITBear科技资讯

相关推荐