比黄仁勋小22岁,雷军要挖他核心人员,梁文锋凭什么让英伟达跌了

360影视 2025-01-27 23:30 2

摘要:软银集团股价一度下跌近6%,创下去年11月1日以来的最大跌幅。上周,特朗普刚刚宣布,OpenAI、软银和甲骨文联合成立投资5000亿美元(折合人民币约3.6万亿元)的“星际之门(Stargate)”项目。

经过了7天的发酵,DeepSeek在美区App Store免费榜上的下载量已经超过了ChatGPT,排在了第一位。

1月27日,DeepSeek已让英伟达在盘前一度跌幅超13%,市值约下跌3991亿美元,也就是大约2.8万亿人民币。

软银集团股价一度下跌近6%,创下去年11月1日以来的最大跌幅。上周,特朗普刚刚宣布,OpenAI、软银和甲骨文联合成立投资5000亿美元(折合人民币约3.6万亿元)的“星际之门(Stargate)”项目。

而DeepSeek背后的主角是比黄仁勋小了22岁的梁文锋。

ChatGPT在AI大模型中排名第一,但是它的地位要变一变了,据DeepSeek推文显示,DeepSeek-V3在性能上和世界顶尖的闭源模型GPT-4o(OpenAI大模型)以及Claude-3.5-Sonnet差不多,DeepSeek-V3在数学、代码能力和中文知识问答方面还超过了ChatGPT-4o。

前Open AI联合创始人、Tesla AI团队负责人安德烈·卡帕西(Andrej Karpathy)在社交平台上发文称,DeepSeek-V3的出现也许意味着不需要大型GPU集群来训练前沿的大语言模型。他还表示,如果此模型还能通过各项评估,那么这将是资源受限条件下研究与工程能力的高度令人印象深刻的展示。

Scale AI创始人亚历山大·王(Alexander Wang)则发文称,DeepSeek-V3给世界上了一课:就在美国休息时,中国在工作,并以更便宜、更快、更强的产品迎头赶上。

DeepSeek-V3在仅使用2048块H800 GPU的情况下,完成了6710亿参数模型的训练,性能上与GPT-4o(OpenAI大模型)比肩,全部训练成本仅为557.6万美元,而GPT-4高达10亿美元,DeepSeek训练成本只有GPT-4o的二十分之一。

OpenAI在2024年的亏损额可能达到50亿美元,业内专家预计到2026年其亏损将进一步攀升至140亿美元。

DeepSeek更注重软件驱动的资源优化,不依赖硬件,能在性能较低的芯片上运行,这对于投入大量资金购买英伟达更高级AI芯片才能训练智能模型的AI公司来说,是一个重大的打击。

雪上加霜的是,英伟达的“老对手”AMD抓住了这次机会,AMD的SGLang 和 DeepSeek 团队通力合作,使 DeepSeek V3 FP8 从首发当天就能在AMD GPU 上运行。

据花旗银行报告,在AI领域,英伟达 H100 GPU的价格高达40000美元,AMD Instinct MI300X价格约为10000美元,采购英伟达的成本要比AMD高出四倍。

如果这条路能行通的话,那么每年花费6000亿美元支付AI硬件费用的美国AI公司将会重新考虑是否还有必要购买英伟达的高级AI芯片,AMD高性价比的GPU将成为首选。

接下来,DeepSeek可能会颠覆英伟达在AI硬件领域的主导地位,AMD将会趁势而上,把英伟达拉下AI领域的神坛。

梁文锋为人低调,开发出这样一款颠覆性的产品,但是在网上却很难找到他的照片。

1985年,出生在湛江市吴川市覃巴镇米历岭村,父母都是知识分子,家庭学习氛围浓厚。

令人想不到的是,他的父母都是语文老师,但是梁文锋却在数学学科表现出极大天赋,初中时期就学完了高中数学,甚至开始学大学的数学。

2002年,他以吴川市第一中学“高考状元”的成绩考上浙江大学电子信息工程专业,毕业后在浙江大学攻读研究生。在大学期间,梁文锋就已积累市场行情数据和探索全自动量化交易。

2015年,梁文锋与朋友一同创办“幻方量化”,志成为世界顶级的量化对冲基金。2016年10月,幻方量化推出第一个AI模型,第一份由深度学习生成的交易仓位上线执行。到2017年底,几乎所有的量化策略都采用AI模型计算。

2023年7月,幻方量化宣布成立创新性大模型公司“深度求索”(DeepSeek),公司包括创始人梁文锋在内,仅有139名工程师和研究人员。

其中有一个核心人员——95后AI“天才少女”罗福莉。她本科就读于北京师范大学,误打误撞进入计算机专业,起初成绩垫底,经过努力,成绩终于爬到了前几。大三时候被打击“你没有天赋做科研”,却凭借天赋和努力保研进入北京大学计算语言学研究所。

她的身上光环众多:北大硕士毕业、一年发8篇顶级会议论文、毕业后横扫BAT最顶级硕士offer。

罗福莉也因此受到了雷军的关注。当时,雷军对小米在大模型领域发力太晚感到担忧,于是亲自下场挖人,对罗福莉开出的薪酬水平或在千万元级别。据第一财经消息,罗福莉有可能供职于小米AI实验室,领导小米大模型团队。只不过罗福莉还没有做出决定去还是不去。

由此可见,梁文锋创立的DeepSeek技术团队实力有多强。

梁文锋能成功,从初中的时候或许就可以发现一些端倪。当时的他性格文静,但不是书呆子,他在学习上很有自己的“一套方法”,看起来天天都在玩,也没见他熬夜学习什么的,却可以学好每一个学科。

这或许就是梁文锋能弯道超车,研发出用很小成本实现高性能的DeepSeek的原因

来源:消息家

相关推荐