摘要:昨天,号称AI的“卖铲人”英伟达股价暴跌,盘中跌幅超过18%,单日的市值蒸发规模超过6000亿美元,创2020年3月以来的最大跌幅,当时正值新冠疫情爆发初期,美股熔断之际。
君不见,中国当前最牛的大公司,比如华为、比亚迪、阿里巴巴等,都是因为有个好老板,有个好掌舵人。
现在,称为世界最厉害人工智能大模型的DeepSeek的85后老板梁文锋,正在全世界掀起了滔天巨浪。
中国人工智能公司DeepSeek正暴击华尔街。
昨天,号称AI的“卖铲人”英伟达股价暴跌,盘中跌幅超过18%,单日的市值蒸发规模超过6000亿美元,创2020年3月以来的最大跌幅,当时正值新冠疫情爆发初期,美股熔断之际。
其他相关的谷歌、英特尔、台积电等头部大公司,股价也大跌8%以上。
可能有人好奇,这是个什么样的老板,能让全世界为之震动?
这个老板真的不简单。
1月20日下午,中共中央政治局常委、国务院总理李强主持召开专家、企业家和教科文卫体等领域代表座谈会,听取对《政府工作报告(征求意见稿)》的意见建议。DeepSeek老板梁文锋,也被总理邀请之列,并在第4个发言。
梁文锋年纪轻轻就成了总理的座上宾,那是何等荣耀,又是何等重要。
梁文锋毕业于浙江大学信息与电子工程学专业,读的是电子工程系人工智能方向。
在浙大攻读硕士研究生期间,就发表了《基于低成本PTZ摄像机的目标跟踪算法研究》高质量论文,可以说是妥妥的技术牛人。
DeepSeek的前身是幻方量化,同样牛气冲天。
2015年,梁文锋与校友共同创立了幻方量化,他们只用了不到5年的时间,搭建了“萤火一号”集群,打造出了超大规模算力底座,成为了中国股市千亿规模的量化私募大厂,这都为DeepSeek奠定了坚实基础。
后来因为证监会不允许用用人工智能大模型进行股市交易,2023年7月17日成立了DeepSeek,主要方向是开发先进大语言人工智能模型。
2024年12月26日,DeepSeek-V3横空出世,不仅标志着国产AI技术的重大进步,也在全球AI界引起了广泛关注和赞誉。
前GoogleSearch成员Deedy表示:DeepSeek-V3将成为全球最强的开源大模型。
OpenAI的创始成员Andrej Karpathy也对此表示了赞同,强调了高效资源利用的重要性。
谷歌Meta的AI科学家田渊栋认为:DeepSeek-V3在多个方面都展现出了惊人的创新。
据专业人士检测,它在MATH500、AIME2024和Codeforces三个维度更是遥遥领先,数学和编程能力极强,远超过GPT-4 和 Claude 3.5 Sonnet 这两大世界领先的闭源模型。即使在某些语言理解和软件工程任务中稍有逊色,但也是TOP2尖子选手。
令人惊讶的是,DeepSeek-V3在性能比肩GPT-4o的同时,研发成本却远低于后者。
DeepSeek-V3仅使用2048块GPU训练了2个月,且只花费557.6万美元,成本仅为GPT的1/20。
Deepseek作为一款全世界开源的人工智能大模型,与美国公司的拼命烧钱、堆算力的全闭源模型形成强烈对比。
1月20日,就在李强总理接见梁文锋的当天,公司又投下DeepSeek-R1开源大模型这个震撼巨弹。
DeepSeek R1开源大模型,媲美OpenAI-o1,超越Claude 3.5,在数学、代码、自然语言推理等任务上的性能比肩GPTo1正式版,且该模型的API服务定价为每百万tokens输入 1元(缓存命中)、每百万tokens 输出16元,远低于OpenAI-o1的55元、438元。
DeepSeek-R1被世界人工智能界比喻为,“人工智能界的拼多多”。
它被广泛认为是可以和OpenAI和Meta的人工智能大模型相竞争,已登上苹果App Store等APP下载排行榜首位。
DeepSeek能够以远低于成本的价格,提供与美国大型科技公司AI聊天机器人相媲美的性能。DeepSeek的低成本AI方案重新点燃了市场对美国科技巨头在AI研发上投入过多资金的担忧。
这种暴击,顿时干溃比特币,还在华尔街掀起了狂风巨浪,仅英伟达市值就蒸发6000亿美元。
有一天,实习生小林攥着写满公式的草稿纸,在实验室门口来回踱步。
3天前,他提出的“动态稀疏激活”方案,却被权威的课题组长以“偏离项目主线”为由驳回。
当他偶遇老板梁文峰时,短短的几句话,就让老板对他的“动态稀疏激活”方案非常重视。
仅5分钟后,整个大模型组的研究员就被临时召集。
梁文峰说:“小林发现用动态门控替代固定参数分配,可能让MoE模型显存占用下降40%。”
资深架构师却表示反对,他说:“但现有框架都是基于静态结构......”
“所以才要改框架。”梁文峰打断道,转身指着黑板的一条螺旋上升的曲线说,“2016年我们做AI量化交易,所有人说必须用华尔街那套因子库,最后结果呢?”
另一个被点名的算法工程师说:“当时您让我们把因子生成权交给神经网络,后来幻方做出了世界第一个全AI策略。”
梁文峰在螺旋尽头重重写下“MLA”三个字母后,坚定地说:“对,自下而上的火种,永远比自上而下的火炬更亮。”
3个月后,在国际机器学习顶会上,DeepSeekMoE的论文引发轰动。在论文致谢栏里,小林的名字排在梁文峰前面。当时有记者好奇地问,为何把实习生放在首位?
梁文峰回复说:“创新不是金字塔,而是雨林——阳光应该照在每一片新芽上。”
这样的老板是何等的胸怀?怎么能不让员工佩服?
最后,梁文锋特别强调,人工智能领域世界前50的顶尖人才不可能来中国,但我们可以打造这样的人才。最近很多国外媒体猜测,DeepSeek作为一个初创公司,能够迅速占据AI领域顶峰,做出颠覆性成果,这个团队核心人员一定是来自至全球该领域的前50名的顶级科学家。
然而,梁文锋在接受媒体采访时却说,“我们团队全是来自国内,甚至是一些Top高校的应届毕业生、没有毕业的博四、博五实习生,以及才毕业没几年的年轻人。”
梁文锋同时特别强调:“有很多人认为我们公司核心成员来自该领域前50名顶尖人才,其实真没有,人家也不可能来中国,但我们也许可以打造这样的人才。”
就是这家不起眼的浙江小科技公司,既没有西方风险投资,更没攀附洋资本,只凭着国货当自强的狠劲,员工也都是国内大学毕业,扎根于浙江大学良好的科创土壤,集中了中国人的智慧,把核心技术牢牢攥在手中。
在一次专访中,梁文锋说:“中国的AI不可能永远跟随,需要有人站到技术的前沿。”
结语梁文锋作为85后的老板,却胸襟开阔,志存高远。
他不但自己是技术牛人,更会识人、用人,最最重要的是,他还着眼国家的发展,立志为国家培养顶级人才。
这才是他最牛的地方!
声明:部分内容和图片来自网络,侵删。
最后,这期关于这期话题,大家还有哪些不一样的看法?欢迎评论区留言分享。
来源:中国男孩教育