摘要:国家一直关注着国内ai的进展,最近一家之前名不见经传的小公司创始人被邀请参加高层座谈会,因为这家公司很不简单,他打破了美国ai大公司描绘的一个神话,也打破了它们的算力霸权。这家公司叫DeepSeek,来自中国杭州。没有西方风险投资注入,员工均毕业于国内大学的企
国家一直关注着国内ai的进展,最近一家之前名不见经传的小公司创始人被邀请参加高层座谈会,因为这家公司很不简单,他打破了美国ai大公司描绘的一个神话,也打破了它们的算力霸权。
这家公司叫DeepSeek,来自中国杭州。没有西方风险投资注入,员工均毕业于国内大学的企业。
他的创始人梁文峰,1985年出生于广东湛江。梁文峰的父亲是一名小学老师,而他本人是一位数学建模爱好者。他本人在浙江大学读的电子工程系人工智能方向。
这家公司的崛起,让人们看到了国产AI的无限潜力。美国方面做了测试,与OpenAI相比,DeepSeek的优势显著。在数学、代码和自然语言推理等任务上,与OpenAI的GPT-4o和GPT-o1正式版表现相当。特别是它在数学能力上,跑分高达90.2%,比GPT-4高出10分以上。
在国际知名AI能力评测机构LiveBench的评比上,这家公司的大模型DeepSeek-R1更是达到了全球第二,仅次于OpenAI 。
此前我说过,这家公司最大的优势是性价比。他用了行业内1/10的成本,做到了行业顶尖性能的90%以上。更让人佩服的是,这家主业是搞量化的公司用副业做出了如此强悍的ai大模型。
杭州这家小公司的出现可以说是上苍给中国ai产业的一个新年礼物,它的成功意义非凡 ,他打破了之前西方ai大公司一直掌握的算力霸权,有力地证明了“算力极限会制约大模型的演进”是一个伪命题。
人脑仅有20瓦功率却拥有600万亿神经元突触,而1000B参数的大模型推理消耗功率需上千瓦,训练消耗更是达百万瓦级别,这说明硬件、架构、算法还有巨大的工程优化空间。这事儿的意义就相当于当年研发氢弹,美国走的是一种路线,中国的天才科学家于敏走了另一种路线。谁说到达罗马的大路永远只有一条?
它给了中国科技界一个巨大的勇气,此前大家都觉得美国人设定的Ai道路就是宇宙中的唯一真理,和牛顿三定律和麦克斯韦方程组那么唯一,那么真理。
这个厂家竟然会走出自己的道路,他们敢想说,美国人的想法和道路可能是有问题的,我能做出更好的,这个想法的突破才是重要的,重大突破!
更为敬佩的是这家公司还将优化过程方法详细写在论文里并开源模型,堪称行业明灯。
DeepSeek团队仅有139名研发人员,是OpenAI的十分之一。创始人梁文峰刚满40岁,此前雷军千万年薪挖的95后天才AI少女也是团队研发成员。
DeepSeek的出现,让世界看到了中国AI的创新力和发展潜力。它以创新的方式,在AI大模型发展上贡献了“中国版本”,为中国AI在全球舞台上赢得了一席之地。
来源:白杨观察室