DeepSeek，为什么这么热闹？

摘要：正如DeepSeek亲自解释的那样,DeepSeek是由中国初创企业"DeepSeek"开发的生成式人工智能(AI)服务。公司名称和服务名称相同。

这里，埋着长得圆滚滚的蓝色鲸鱼。

"你好，我是DeepSeek。请问有什么可以帮助您的？"

看起来非常温顺的小鲸鱼终于做到了。只要一播放新闻，都是"DeepSeek"的故事。

DeepSeek，到底是什么，这么热闹？

■ 中国创业企业"DeepSeek"制造的生成型AI"Deepsic"

正如DeepSeek亲自解释的那样,DeepSeek是由中国初创企业"DeepSeek"开发的生成式人工智能(AI)服务。公司名称和服务名称相同。

生成型AI顾名思义就是"生成"文本、图片、视频等新内容的人工智能技术。最广为人知的是美国开放AI公司开发的"ChatGPT"。

左边是ChatGPT，右边是DeepSeek首页。看起来怎么样？不觉得差不多吗？

不只是长相相似。性能也差不多。

但是还是不太理解。

生成式AI又不是只有ChatGPT，多出一个性能相似的AI，有那么重要吗？

如果要说明这一点，就要深入一点。关于ChatGPT和DeepSeek的"推理"模型！

生成式AI有很多型号。聊天GPT也一样。其中,目前通用性最常用的就是"GPT-4o"模型。

下面能看到"o1"模型吧。上面写着可以逻辑解释，简称为"推理"模型。

通用模型和推理模型，这两者有何不同？最容易理解下面的实验。

"获得职友奖的翻译……' 知道是什么意思吗？一看就很难理解是什么意思。 AI也一样。

给ChatGPT通用模型GPT-4o一个拼写错误的句子，答案就这样回来了。因为有很多错误的表达，所以很难正确翻译。

但是推论模型o1不同。

突然分析出拼写法乱七八糟的文章，不到0秒就完成了英语翻译。

我第一次看到这个视频，其实都起鸡皮疙瘩了。推理的AI，是不是很像人？

此前,将这种推论模式商用化的只有开放AI的聊天GPT。谷歌和埃隆马斯克都没能做到。

所以这个推论模型的存在就像是一种象征。在AI行业没有人能赶上我们,是一样的感觉。

但不知为何,中国的一家创业公司向世人推出了与GPT-o1相对应的,甚至在数学等领域反而超越了GPT-o1的"DeepSeek-R1"。

而且,与包括开放AI在内的美国大型科技企业用于AI开发的金额相比,花费了非常低廉的费用。

让所有人都大吃一惊。

■ 开发费的十分之一？那个可能吗？

在DeepSeek面前经常出现的修饰语是"性价比"。性能固然重要,但核心是以低廉的费用实现这一性能。

DeepSeek在上个月推出推论型"R1"车型的一个月前公开了通用车型"V3",之后还堂堂正正地发表了技术报告书。

这里就是开发费用的部分,关于费用大致可以概括为3种。

据悉,报道中经常接触到的"80亿韩元"出现在这里,该金额比美国大型科技企业Open AI或Meta在AI开发上花费的费用少十分之一以上。

从结论来看,DeepSeek可能比这个花得更多,但大部分观测认为,即使如此,也会比大科技企业花的少。

首先DeepSeek自己也说过的80亿韩元中，除了训练费用之外，其他费用都没有算进去，所以人工费等其他费用到底花了多少，其实谁也不知道。

更何况,该报告不是关于此次旋风的主人公推论模型"R1",而是关于其前身"V3"的技术报告。也就是说,认为更高级的R1投入了更多的钱是合理的。

据悉,作为R1基础的V3也是以前身V2和更先进的型号为基础,经过反复试验后开发的,DeepSeek的母公司拥有很多英伟达的高性能芯片。

因此,现在断定DeepSeek只开发出了低配置芯片H800芯片,费用仅为大科技企业的十分之一,即80亿韩元还为时尚早。

尽管如此,专家们还是说"确实开发得很便宜"的理由,其中最后还有DeepSeek的"技法"。

■ "God性价比"，DeepSeek是怎么做到的呢？

这是一部关于DeepSeek技巧最"火"的网络漫画。

在大而广的数据海洋中,"Open AI"猫钓鱼后,用铁桶装了聊天GPT,结果"DeepSeek"猫把里面的鱼钓走了。当然少花时间和钱了。

当然,这只是为了帮助理解而比喻的,并不是说DeepSeek确实如此。虽然有人质疑所谓的"抄袭"，但并未得到证实。

但是开发AI时,实际上有和这幅漫画相似的概念。英语叫Distillation，蒸馏。

应该说是蒸馏葡萄酒制作干邑的感觉吗？为了提高运算效率，让更小更轻的模型学习更大更重的AI模型知识。

这样,在体现更大型号性能相似的同时,可以在更轻的机器上,以更快的速度启动AI。

除了这种蒸馏技术外,DeepSeek在训练AI时,不像以前那样由人反馈,而是使用了其他AI训练的强化学习法,节省了费用。

对此,高丽大学人工智能研究所所长崔炳浩解释说:"DeepSeek在节省费用的同时,还想提高质量,因此为了寻找最低点,做出了很大的努力。"

■有DeepSeek的前后

另一个在DeepSeek相关报道中经常出现的说法是"Sputnik瞬间"

1957年苏联成功发射世界第一颗人造卫星"斯普特尼克1号"后,美国全境都陷入了冲击。在宇宙领域，苏联自信绝对赶不上他们。

第二年,美国成立了我们熟知的美国航空航天局NASA,12年后人类首次成功将人类送上月球。

DeepSeek给AI行业，尤其是美国带来的冲击，和Sputnik瞬间差不多。

自2022年开放AI向公众开放聊天GPT以来，全球震惊，所有行业和经济都以AI为主进行重组。领先的是包括开放AI在内的美国。

大家在美国后面努力奔跑，但距离领先的差距并没有缩小。反而越来越大了。

AI开发需要很多钱,这是现有业界的定论。后起之秀们纷纷表示"是啊，我没钱啊。我不行"，只能呆呆地看着差距拉大。

但是这时候登场的就是DeepSeek。性能与聊天GPT相似,制作了更快、更便宜的AI,还公开了自己是如何开发的。

DeepSeek并不完美。除了减少开发费用，担心个人信息泄露,到处都出现了"禁令"。

但是,可以肯定的是,DeepSeek向只能无力地注视着美国领先的AI业界抛出了有意义的变化球。

画有蓝鲸的"DeepSeek"号已经登上了名为AI的广阔宇宙。对于梦想成为AI三大强国的韩国来说,重要的不是"酸葡萄",而是反转或飞跃的机会。

来源：爱生活的阿土伯

标签： gpt deepseek sputnik

本文地址：https://news.43u.com.cn/a/607129.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!

相关推荐