摘要:DeepSeek横空出世,不仅震撼中国,更是把西方人工智能界震撼得摸不着北,DeepSeek这个名字在全球范围内,尤其是在硅谷,被称作“来自东方的神秘力量”。
DeepSeek横空出世,不仅震撼中国,更是把西方人工智能界震撼得摸不着北,DeepSeek这个名字在全球范围内,尤其是在硅谷,被称作“来自东方的神秘力量”。
DeepSee单枪匹马闯天下,想不到成为欧美科技股的粉碎机。DeepSeek的崛起不仅引发硅谷怀疑美国在人工智能领域领先地位,也动摇投资者对人工智能行业对高科技晶片的巨大需求信心,促使投资者星期一(1月27日)纷纷抛售全球科技股。
科技股占主导的美国纳斯达克指数星期一下跌3.1%,其中英伟达成最大拖累,股价下跌近17%,市值蒸发5927亿美元,创下华尔街股票市值单日最大跌幅的纪录。
美国股市的下跌紧随亚洲市场的抛售,日本软银集团星期一收跌8.3%;这股抛售潮也蔓延至欧洲市场,荷兰半导体设备公司阿斯麦星期一下跌7%。
一时间,人们都开始寻找这个震撼世界的DeepSee的前世今生,人们都不由自主发问,为何它过去一直隐姓埋名,为何它能够王炸那些过去一直高调宣称投资AI和算法的网红公司?
开发这个模型的国内大模型公司DeepSeek(简称“深度求索”),母公司是幻方量化。DeepSeek成立于2023年7月,注册资本1000万元。这家极为低调的创业公司,网上以前一直隐姓埋名,很多人不知道它的存在,它选择了“深潜”,不想与外部有任何形式的交流互动。
幻方量化被称为“核动力镰刀”,当散户炒股,还是盯着K线图的时候,狡猾的私募已经是量化领域的顶级玩家,用AI炒股,用算力割韭菜,堪称精准收割机。人脑跟电脑斗,还能有赢面?
巨大的利润,也许是DeepSeek默不作声的理由,也是它不断发展的动力。
2015年,幻方量化成立,次年推出第一个AI模型,第一份由深度学习生成的交易仓位上线执行,2018年确立以AI为主要发展方向。2020年,幻方累计投资超亿元、占地面积相当于一个篮球场的AI超级计算机“萤火一号”正式投入运作,号称可以匹敌4万台个人电脑的超级算力。2021年,幻方投入十亿建设“萤火二号”,“配备了1万张A100GPU芯片”。当时国内超过1万枚GPU的企业不超过5家,而且除了幻方量化之外,其他4家公司都是互联网大厂。
梁文锋也是头部量化私募幻方量化的创始人。梁文锋本科、研究生毕业于浙江大学,拥有信息与电子工程学系本科和硕士学位。2008年起,他开始带领团队使用机器学习等技术探索全自动量化交易。
DeepSeek的成功,让人们看到古时候的程咬金。程咬金从混世魔王到唐朝的护国将军,这多少有些文学传奇,而DeepSeek确是现代程咬金的翻版。
DeepSeek的成功之处,就是被称为AI界的拼多多,根据其技术报告,该模型的正式训练成本约为558万美元,但这一数据并不包括架构、算法、数据相关的前期研究和消融实验的成本。
当中国面对人工智能美国封锁的时候,特别是先进GPU中国买不到的时候,在中国上下为如何突破美国英伟达禁令一筹莫展的时候,混世魔王程咬金的到来,让所有人都喜形于色。
DeepSeek为中国模界杀出一条血路,创始人梁文锋自然被当做“护国将军”。
近期,梁文锋还现身《新闻联播》,参加了一场国家超高规格座谈会,并现场发言,分享了哪些可能改变全球科技未来趋势的深度见解。
梁文锋在访谈中提到:“我们认为,随着经济的发展,中国也应该逐步成为技术创新的主要贡献者,而不是一直依赖别人的成果。过去三十多年的IT浪潮中,我们基本没有参与到真正的技术创新里。我们已经习惯了摩尔定律带来的便利,18个月后就会有更好的硬件和软件出现。但事实上,这些都是西方主导的技术社区一代代努力创造出来的。只是因为我们之前没有参与这个过程,所以忽视了它的存在。”
他进一步解释道:“我们缺乏的并不是资本,而是信心和如何组织高密度的人才来实现有效的创新。过去三十年,我们都只强调赚钱,对创新是忽视的。创新不完全是商业驱动的,还需要好奇心和创造欲。我们只是被过去的惯性束缚了,但它也是阶段性的。”
过去中国确实存在搭便车行为,现在随着中国科技发展,中国引领科技的时代,应该已经到来。
这一次不得不再提一次 何祚庥这位老科学家,他不知道是不是认为中国在现代科学一直贡献是零?人们希望何祚庥老人,认真评价一次DeepSeek的对欧美科技界颠覆。
DeepSeek的成功,是中国给特朗普总统上任最好的见面礼,我们今后对特朗普谈判,就多了一个砝码,所以称DeepSeek也确实不为过,它和华为、大疆等公司也称得起。
来源:笑看云跳舞