摘要:面对中国公司DeepSeek的AI模型R1大杀四方,硅谷大佬们集体破防:马斯克质疑显卡用量,微软调查数据来源,美国政客甚至搬出“盗取技术”的帽子——素有“硅谷鲁迅”之称的LeCun反手在X上开启了反讽模式。
当DeepSeek(以下简称DS)成为全球AI顶流,X上也为了它快“吵”起来了。
一边是以OpenAI和Anthropic为代表的“警惕派”,另一边,更多的科技大佬们开始成为了DeepSeek的粉丝。
面对中国公司DeepSeek的AI模型R1大杀四方,硅谷大佬们集体破防:马斯克质疑显卡用量,微软调查数据来源,美国政客甚至搬出“盗取技术”的帽子——素有“硅谷鲁迅”之称的LeCun反手在X上开启了反讽模式。
话里话外强调着科学进步靠的是“全球学霸组队刷题”,而不是“学霸笔记加密上锁”。
另一边,HuggingFace联合创始人Thomas Wolf直接当起了课代表,替网友们总结DS曝光以来,他们的所见所想。尽管这一部分来自于开源社区和开源模型天然站在同一条战线上,但Thomas本人几度认为DS和R1是历史性的颠覆时刻。
作为Anthropic的忠实崇拜者和Claude的长期用户,当Thomas看到了Dario关于DS和出口管制的文章,他诚实地表示:相当痛苦。
“这篇文章的前半部分读起来像是一篇冗长的尝试,试图证明闭源模型仍然明显领先于 DeepSeek。如果 DeepSeek 和 Anthropic 模型都是闭源的,是的,军备竞赛的解释可能是有道理的,但是在我看来,让其中一个模型可以免费下载并附有详细的科学报告,这使得整个‘闭源军备竞赛’的论点变得人为且没有说服力。”
开源没有国界。Aitomatic创始人兼CEO Christopher Nguyen甚至认为,开源并不是一种策略,而是一种必然。
当然,AWS、Azure和Nvidia这些直接的利益相关者一边迫不及待身体力行的在自己的云平台上部署R1和R1-Zero,另一边也在X上以此为机会,来俘获开发者们的芳心。
Perplexity创始人Aravind Srinivas在R1刚刚出现时,其团队便将其与o3进行详细的测试和比对,最终得出的结论是:比o3更聪明。
甚至直接将美版R1接入了Perplexity中,为Pro用户提供每天500次的R1查询。
除了受益于R1开源战略的直接利益相关者,另一部分的粉丝则是惊叹于DeepSeek对于成本的极限控制,尽管这并不是什么新鲜事,但R1让整个技术界,又震惊了一次。
曾任Tesla总监,也是OpenAI的前创始团队之一的Andrej Karpathy,直接称:美国在数据和算法层面还有很多工作要做。他举例:同样级别的Llama 3 405B使用了 30.8M GPU 小时,而 DeepSeek-V3 看起来是一个更强大的模型,只用了 2.8M GPU 小时(计算量减少了 ~11 倍)。
Scale.ai创始Alexandr Wang提到了R1在训练数据方面的突破了世界纪录,并更重视数据标注,CEO亲自为模型进行标注。“这让我想起了 Karpathy当年,曾经在特斯拉花了四分之一的时间进行标注。DeepSeek-v3 论文甚至有一个专门的数据标注部分 。”
Midjourney创始人David Holz甚至已经成为了DS的小迷弟,David一直在思考AI与人类的本质区别等哲学问题,DS的回答让他感到惊喜。
DeepSeek把学术研究和工程落地揉成了组合拳。一边发前沿论文定义新标准,一边开源实用工具降低使用门槛,这种“两条腿走路”的策略反而撕开了行业痛点:大多数团队还在纠结技术路线时,他们已经把方案塞进了开发者的日常工作流。或许AI创新的关键,就是把实验室的突破变成程序员键盘上的默认选项。
可以预见的是,这些海外大佬“自来水”还会越来越多。说到底,这些热闹都是因为DeepSeek的技术干货够硬。当技术方案真正解决问题时,所谓的“东西方差异”会自动消失。
来源:硅星人