研究机构:DeepSeek硬件GPU支出超过5亿美元

360影视 2025-02-02 16:45 2

摘要:中国创业公司DeepSeek模型成本引发热议,并且造成股市震荡。研究机构SemiAnalysis今天报告指出,至今硬件绘图处理器(GPU)支出远超过5亿美元。

中国创业公司DeepSeek模型成本引发热议,并且造成股市震荡。研究机构SemiAnalysis今天报告指出,至今硬件绘图处理器(GPU)支出远超过5亿美元。

SemiAnalysis指中国对冲基金幻方量化(High-Flyer)2023年5月成立“深度求索”(DeepSeek)以推动AI研发,之前幻方量化2021年,也就是任何出口管制生效前,投资买了一万颗英伟达(Nvidia)A100 GPU。

故DeepSeek的GPU投资花费超过5亿美元。

英伟达根据法规要求,生产多款H100变化版如H800、H20。目前仅H20可销售至中国。英伟达过去九个月生产超过百万颗专供中国市场的H20 GPU。报告分析,DeepSeek服务器总资本支出(CapEx)约16亿美元。

DeepSeek从中国本土招募人才,目前约有150名员工,急速扩张中。DeepSeek价格和性能这周因出现模型训练成本低于600万美元的说法引起讨论。但报告强调预训练成本仅占总成本小部分,不代表完整支出。

DeepSeek论文提到的600万美元成本指的是预训练运行(pre-training run)的GPU成本,只占模型总成本部分,未计入的重要支出还包括研发(R&D)、硬件总拥有成本(Total Cost of Ownership)等关键因素。报告也提到DeepSeek获大量算力资源与出口管制与时间滞后(lag)有关。

美国智库兰德公司(RAND)研究员海姆(Lennart Heim)近期分析,硬件出口管制有时间滞后,尚未完全发挥影响力。真正考验将出现在数据中心需升级或扩展时,这对美国企业较容易,但对受出口管制的中国企业而言就是挑战。

SemiAnalysis也评价,DeepSeek开放权重模型表现出色,超越Meta Llama、法国人工智能创业公司Mistral AI及其他竞争者。

来源:十轮网

相关推荐