摘要:1月27日,深度求索(DeepSeek)发布的DeepSeek-R1模型,问鼎苹果中、美应用商店免费App下载排行榜第一。
DeepSeek,太火了。
1月27日,深度求索(DeepSeek)发布的DeepSeek-R1模型,问鼎苹果中、美应用商店免费App下载排行榜第一。
问鼎第一
无论是行业内的专家,还是普通人,都在争相使用这款AI产品。
在资本市场上,多只DeepSeek“概念股”在连续涨停。
随着热度攀升,网络黑产也盯上了这一“香饽饽”。
据奇安信XLab实验室的最新报告显示,已有2650个网站仿冒DeepSeek。
DeepSeek之所以这么火,一方面,是因为技术的领先。
DeepSeek的DeepSeek-R1模型,预训练费用只有557.6万美元、不及OpenAI GPT-4o模型训练成本1/10的模型,却有能力执行与OpenAI o1相同级别的推理任务,并且开放供研究人员检查。
这让DeepSeek的收费,仅相当于Open AI o1运行成本的约三十分之一,具有极强的价格优势。
DeepSeek的“低成本”、“高性能”,击碎了“算力信仰”,导致英伟达股价暴跌,市值蒸发6000亿美元(约合4.3万亿元人民币),特斯拉、苹果、微软等科技公司股价也纷纷重挫。
另一方面,引发了美国的忌惮。
1月28日起,DeepSeek线上服务受到接二连三的大规模恶意攻击,导致平台注册繁忙。
受到恶意攻击
美国也对DeepSeek进行禁用、调查。
更为关键的是,DeepSeek是在美国芯片封锁的大背景下取得这一成就的。
这让DeepSeek披上了一股“孤胆英雄”的光辉。
以一己之力单挑美国,网友惊呼,DeepSeek的诞生,堪称“爽文”情节。
正解局想说的是,真不是“爽文”。
DeepSeek的回答
关于这一点,DeepSeek这样回答:
DeepSeek的诞生并非虚构的“爽文”情节,而是科技进步和团队努力的成果。它是由深度求索(DeepSeek)公司基于大量数据和先进算法开发的智能助手,旨在提供高效、准确的信息服务。DeepSeek的出现反映了人工智能领域的快速发展,是现实世界科技创新的一部分。
我们先来看看DeepSeek的出品方——深度求索公司做了哪些工作。
深度求索的创始人梁文锋,2002年,以吴川一中“高考状元”的成绩考上浙江大学本科电子信息工程专业。
2015年,梁文锋成立了幻方量化,通过数学和AI进行量化投资。
2019年,梁文锋在金牛奖颁奖仪式上
2023年5月,深度求索从幻方量化拆分出来,全面专注于AI业务。
虽然到现在也只有1年多时间,但是,梁文峰团队在AI领域已有至少10年的积累。
根据SemiAnalysis的估算,幻方在购买GPU、搭建服务器等方面的投入,至少花费了26亿美元。
深度求索绝不是“白手起家”,而是在持续的积累、投入。
此外,我们还要看到行业和国内创新生态的进步。
虽然DeepSeek青出于蓝胜于蓝,但也要看到ChatGPT的示范意义。
OpenAI发布的ChatGPT让全球看到了大模型的重要价值,引发了全球大模型热潮。
在这股热潮中,百度、阿里巴巴、腾讯、科大讯飞等中国科技巨头在大模型研发上投入大量资源,推出了如ERNIE、PLUG、盘古、讯飞星火X1等大模型。
比如,科大讯飞发布的当前全国产算力平台上唯一的深度推理大模型——讯飞星火X1。
该模型中文数学能力国内第一,并率先应用于教育、医疗等刚需场景。
科大讯飞发布讯飞星火X1
科技巨头入局,既加速了大模型技术的创新,也推动了高校和科研机构在人工智能领域的教育和研究,培养了更多专业人才。
这一切,为DeepSeek的诞生创造了条件。
DeepSeek的回答
对此,DeepSeek的回答是——
DeepSeek的诞生确实是在人工智能领域众多先驱工作的基础上实现的。正如牛顿所言,我们之所以能看得更远,是因为站在巨人的肩膀上。DeepSeek借鉴了机器学习、自然语言处理等领域的研究成果,结合深度求索(DeepSeek)公司的技术创新,开发出了这一智能助手。它的出现是科技进步的延续,也是对未来人工智能发展的一种探索。
对此,正解局更喜欢网上的另一种说法:
DeepSeek是国运级别的科技成果。
DeepSeek不是“横空出世”,而是中国科技创新生态下,一家公司长期投入,一群顶尖人才持续研发的结果。
技术创新,只有心存敬畏、脚踏实地、攻坚克难,哪有什么“爽文”情节!
来源:正解局