摘要:1月28日,英伟达暴跌16.86%,5800亿美元蒸发,创造史上最大市值损失记录。
1月28日,英伟达暴跌16.86%,5800亿美元蒸发,创造史上最大市值损失记录。
全美半导体行业,也集体陷入了恐慌:
博通跌超17%,台积电跌超13%,美国科技跌超11%,Arm Holdings跌超10%,AMD跌超6%,阿斯麦跌超5%……
而之所以有这些“变动”,源头是:
DeepSeek国产AI大模型的横空出世。
根据专业大模型排名Arena,在1月24日公布的最新排名:
DeepSeek-R1基准测试已经升至全类别大模型第三,其中在风格控制类模型分类中与OpenAI o1并列第一。
投资领域的大佬Andreesen,曾先后投资过OpenAI、Databricks、Shield AI等Al产品,也频频感叹道:
DeepSeek R1是我见过的最令人惊叹,最令人印象深刻的突破之一,并且是开源的,是对全世界的大礼。
DeepSeek是真的震惊了硅谷。
它之所以震惊,主要有两个原因,一是它是完全开源的大模型:
任何人都可以用。
二是用了极小的成本,更小的算力,更高明的算法,实现了比“前辈们”更强的能力,正如网上流传的那样:
用几百万美元,完成了几十亿美元的项目。
硅谷AI巨头们的神经,已经错乱了。
而主导这一切的,是一个极其低调的人:
梁文峰。
梁文锋和公司团队开发的大模型“DeepSeek-V3”上线后,轰动硅谷、震惊全球。
各种海外媒体中,梁文锋被称为:
来自东方的神秘力量。
因为在这之前,他实在太低调了。
可他的人生,一点都不简单。
梁文锋是湛江市吴川市覃巴镇米历岭村人。
他出生于1985年,成长于一个教师家庭,父母都是小学语文老师。
梁文锋成长阶段,赶上了“下海潮”,“读书无用论”一度传的沸沸扬扬。
他的好多同学,都先后“辍学”挣钱去了。
好在梁家父母作为老师,知道“读书”的重要性,从小就对儿子严格要求:
学生时代的梁文锋,一直是学校里的“尖子生”。
而且虽说父母都是教语文的,可梁文锋更感兴趣的是:
数学。
他天赋极高,初中时期就学完了高中数学,甚至开始学大学的数学。
梁文锋火了以后,他的的初中班主任容先生,在采访中表示:
初中时期的梁文锋性格很文静,但不是书呆子,他在学习上很有自己的“一套方法”,很注重劳逸结合。
仿佛不需要花很多时间来学习,就可以学好每一个学科。
他是妥妥的“学霸”。
以至于2002年,17岁的梁文锋,以吴川市第一中学“高考状元”的成绩,考上浙江大学电子信息工程专业。
毕业了以后,又在浙江大学攻读研究生。
只是虽说就读于名校,可由于那个时候实在是太早,梁文锋读的AI工程专业前景并不明朗。
梁文锋也一度迷茫。
大学期间创业,还做过全自动绣花机等产品,走过一些“弯路”。
与众不同的是,梁文锋很快就根据实践,总结出了自己的方向:
算法。
所以早在大学期间,梁文锋就已经开始:
积累市场行情数据和探索全自动量化交易。
后来读研期间,梁文锋还发表过一篇关于PTZ摄像机目标跟踪算法的论文。
最重要的是当时,正赶上了全球金融风暴,他从中看到了历史的巨大机遇:
很长的一段时间,他都在尝试用把自己机器学习算法和金融联系在一起,实现自动量化交易。
一位梁文锋公司的交易员,曾描述过自己的工作:
早上开盘前开电脑,系统自检并进入交易状态,然后上网聊天打发时间。
如果今天没客户拜访,就看书、游泳、跑步、逛街。
早些年还会经常看交易报告,甚至介入人工操作,后来发现是没意义的事,做多反而错多,想起来才会看一下报告,有时候会为自己插不上手而黯然神伤。
听起来好像很“欠揍”,可那确实是事实。
那也是梁文峰努力的结果。
梁文锋从2008年,开始研究“自动量化交易”,一路边实践边探索,在2015年,创办了幻方量化基金公司。
和传统基金公司不同的是,量化投资的“模式”,它就是梁文锋所强调的:
不靠人力来做买卖抉择,而是在大数据基础上,依靠人工智能来买月殳票。
这一年,梁文锋才30岁。
努力多年的梁文锋,也到了收获的时候:
2018年,幻方量化因为表现亮眼,首次获得了中国私募证券领域的最高奖项——私募金牛奖。
2019年,幻方量化的管理规模突破百亿元。
2021年,幻方量化的资金管理规模突破千亿,成为行业内的“量化四大天王”之一。
梁文锋一跃成为了“大佬”,只是就像是他的同学说的:
有钱了以后,梁文锋的衣着打扮和为人处世也非常低调。
甚至连“捐款”,都是偷偷的。
比如2022年年度,幻方量化共计向慈善机构捐赠 2.2138 亿元,而在这之外,公司一名id为“一只平凡的小猪”的员工:
个人向慈善机构捐赠1.38 亿元。
要知道2022年上半年,非银金融行业共计捐赠,才1.65亿元。
而id名为“一只平凡的小猪”的员工,个人捐款金额就已经接近了这一数据。
关键整件事,完全是“私下”进行的,一点热度都没有。
一直到后来事情发酵,网友们才扒出“一只平凡的小猪”,其实就是:
梁文锋。
但其实2022年,梁文锋的日子也不是太好过。
因为各种原因,大概从2021年下半年,幻方量化也没有了往日的辉煌。
2021年9月开始,幻方量化的业绩便出现下滑。
宁波幻方量化至2022年4月,一度动态回撤超过20%。
可即便如此,梁文锋始终没有停止“慈善”,并且他又找到了新的方向:
人工智能。
3故事的新篇章,开始于2023年5月:
38岁的梁文锋,宣布要做通用人工智能。
两个月后,创办了杭州深度求索人工智能基础技术研究有限公司,也就是DeepSeek公司。
其实在成立公司以前,梁文锋就已经布局:
在基金公司赚取的利润支撑下,梁文峰老早就开始大量采购英伟达的芯片。
一家基金公司,囤积了超过1万张芯片,这个数量比国内很多互联网大厂还多。
当时好多人在猜测梁文锋的意图,却没想到他其实是要“换赛道”。
做人工智能这一年,梁文峰已经是“商场老人”。
可DeepSeek团队,他摒弃了传统的“招人方式”,独具一格的选择了一个纯粹的本土研发团队:
只有中国程序员,没有海归人才。
好多被选中的,都是应届毕业生和毕业一两年的年轻人。
工作时间也不长,不少还是在读博士,即便是团队的管理者,也非常年轻。
最重要的一点是,梁文峰也不在乎应聘者的学术荣誉,或者发很多论文。
只需要你有热爱、有信仰。
在梁文峰的掌控下,DeepSeek团队的规模只有不到140人,工程师和研发人员几乎都来自清华大学、北京大学、中山大学、北京邮电大学等国内顶尖高校,就像他说的:
V2模型没有海外回来的人,都是本土的。
前50名顶尖人才可能不在中国,但也许我们能自己打造这样的人。
事实证明梁文锋,没有看错人。
他带领团队创建的DeepSeek,仅用2048张GPU,耗资557万美元,在53天内,打造出全球领先的大模型“DeepSeek-V3”。
所谓的DeepSeek-V3,一举动摇了闻名天下的OpenAI的统治地位。
关键所花费的经费,还不到其他硅谷AI开发团队的一个零头,甚至还不到这些团队一个主管的工资。
一位Meta的工程师,见证了DeepSeek的崛起以后,在美国科技公司员工社区Blind中,写道:
Meta的生成式AI部门正处于恐慌中。
这一切始于DeepSeek,它使得 Llama 4 在基准测试中已经落后,雪上加霜的是:
那个不知名的中国公司,仅有550万美元的训练预算。
工程师们正在疯狂地剖析DeepSeek,并试图从中复制一切可能的东西。
梁文锋真的带领团队,走到了最前面。
记得DeepSeek-R1上线之后,英伟达高级研究科学家JimFan在其个人社交平台表示:
我们正身处这样一个历史时刻:一家非美国公司正在延续OpenAI最初使命——通过真正开放的前沿研究赋能全人类。
可那正是梁文锋想要的。
就像是采访中,他曾经说过的:
中国的AI不可能永远跟随,需要有人站到技术的前沿。
是结束也是开始。
来源:今夜无设防