DeepSeek,为什么这么热闹?

360影视 2025-02-07 18:55 3

摘要:正如DeepSeek亲自解释的那样,DeepSeek是由中国初创企业"DeepSeek"开发的生成式人工智能(AI)服务。 公司名称和服务名称相同。

这里,埋着长得圆滚滚的蓝色鲸鱼。

"你好,我是DeepSeek。 请问有什么可以帮助您的?"

看起来非常温顺的小鲸鱼终于做到了。 只要一播放新闻,都是"DeepSeek"的故事。

DeepSeek,到底是什么,这么热闹?

■ 中国创业企业"DeepSeek"制造的生成型AI"Deepsic"

正如DeepSeek亲自解释的那样,DeepSeek是由中国初创企业"DeepSeek"开发的生成式人工智能(AI)服务。 公司名称和服务名称相同。

生成型AI顾名思义就是"生成"文本、图片、视频等新内容的人工智能技术。 最广为人知的是美国开放AI公司开发的"ChatGPT"。

左边是ChatGPT,右边是DeepSeek首页。 看起来怎么样? 不觉得差不多吗?

不只是长相相似。 性能也差不多。

但是还是不太理解。

生成式AI又不是只有ChatGPT,多出一个性能相似的AI,有那么重要吗?

如果要说明这一点,就要深入一点。 关于ChatGPT和DeepSeek的"推理"模型!

生成式AI有很多型号。 聊天GPT也一样。 其中,目前通用性最常用的就是"GPT-4o"模型。

下面能看到"o1"模型吧。 上面写着可以逻辑解释,简称为"推理"模型。

通用模型和推理模型,这两者有何不同? 最容易理解下面的实验。

"获得职友奖的翻译……' 知道是什么意思吗? 一看就很难理解是什么意思。 AI也一样。

给ChatGPT通用模型GPT-4o一个拼写错误的句子,答案就这样回来了。 因为有很多错误的表达,所以很难正确翻译。

但是推论模型o1不同。

突然分析出拼写法乱七八糟的文章,不到0秒就完成了英语翻译。

我第一次看到这个视频,其实都起鸡皮疙瘩了。 推理的AI,是不是很像人?

此前,将这种推论模式商用化的只有开放AI的聊天GPT。 谷歌和埃隆马斯克都没能做到。

所以这个推论模型的存在就像是一种象征。 在AI行业没有人能赶上我们,是一样的感觉。

但不知为何,中国的一家创业公司向世人推出了与GPT-o1相对应的,甚至在数学等领域反而超越了GPT-o1的"DeepSeek-R1"。

而且,与包括开放AI在内的美国大型科技企业用于AI开发的金额相比,花费了非常低廉的费用。

让所有人都大吃一惊。

■ 开发费的十分之一?那个可能吗?

在DeepSeek面前经常出现的修饰语是"性价比"。 性能固然重要,但核心是以低廉的费用实现这一性能。

DeepSeek在上个月推出推论型"R1"车型的一个月前公开了通用车型"V3",之后还堂堂正正地发表了技术报告书。

这里就是开发费用的部分,关于费用大致可以概括为3种。

据悉,报道中经常接触到的"80亿韩元"出现在这里,该金额比美国大型科技企业Open AI或Meta在AI开发上花费的费用少十分之一以上。

从结论来看,DeepSeek可能比这个花得更多,但大部分观测认为,即使如此,也会比大科技企业花的少。

首先DeepSeek自己也说过的80亿韩元中,除了训练费用之外,其他费用都没有算进去,所以人工费等其他费用到底花了多少,其实谁也不知道。

更何况,该报告不是关于此次旋风的主人公推论模型"R1",而是关于其前身"V3"的技术报告。 也就是说,认为更高级的R1投入了更多的钱是合理的。

据悉,作为R1基础的V3也是以前身V2和更先进的型号为基础,经过反复试验后开发的,DeepSeek的母公司拥有很多英伟达的高性能芯片。

因此,现在断定DeepSeek只开发出了低配置芯片H800芯片,费用仅为大科技企业的十分之一,即80亿韩元还为时尚早。

尽管如此,专家们还是说"确实开发得很便宜"的理由,其中最后还有DeepSeek的"技法"。

■ "God性价比",DeepSeek是怎么做到的呢?

这是一部关于DeepSeek技巧最"火"的网络漫画。

在大而广的数据海洋中,"Open AI"猫钓鱼后,用铁桶装了聊天GPT,结果"DeepSeek"猫把里面的鱼钓走了。 当然少花时间和钱了。

当然,这只是为了帮助理解而比喻的,并不是说DeepSeek确实如此。 虽然有人质疑所谓的"抄袭",但并未得到证实。

但是开发AI时,实际上有和这幅漫画相似的概念。 英语叫Distillation,蒸馏。

应该说是蒸馏葡萄酒制作干邑的感觉吗? 为了提高运算效率,让更小更轻的模型学习更大更重的AI模型知识。

这样,在体现更大型号性能相似的同时,可以在更轻的机器上,以更快的速度启动AI。

除了这种蒸馏技术外,DeepSeek在训练AI时,不像以前那样由人反馈,而是使用了其他AI训练的强化学习法,节省了费用。

对此,高丽大学人工智能研究所所长崔炳浩解释说:"DeepSeek在节省费用的同时,还想提高质量,因此为了寻找最低点,做出了很大的努力。"

■有DeepSeek的前后

另一个在DeepSeek相关报道中经常出现的说法是"Sputnik瞬间"

1957年苏联成功发射世界第一颗人造卫星"斯普特尼克1号"后,美国全境都陷入了冲击。 在宇宙领域,苏联自信绝对赶不上他们。

第二年,美国成立了我们熟知的美国航空航天局NASA,12年后人类首次成功将人类送上月球。

DeepSeek给AI行业,尤其是美国带来的冲击,和Sputnik瞬间差不多。

自2022年开放AI向公众开放聊天GPT以来,全球震惊,所有行业和经济都以AI为主进行重组。 领先的是包括开放AI在内的美国。

大家在美国后面努力奔跑,但距离领先的差距并没有缩小。 反而越来越大了。

AI开发需要很多钱,这是现有业界的定论。 后起之秀们纷纷表示"是啊,我没钱啊。 我不行",只能呆呆地看着差距拉大。

但是这时候登场的就是DeepSeek。 性能与聊天GPT相似,制作了更快、更便宜的AI,还公开了自己是如何开发的。

DeepSeek并不完美。 除了减少开发费用,担心个人信息泄露,到处都出现了"禁令"。

但是,可以肯定的是,DeepSeek向只能无力地注视着美国领先的AI业界抛出了有意义的变化球。

画有蓝鲸的"DeepSeek"号已经登上了名为AI的广阔宇宙。 对于梦想成为AI三大强国的韩国来说,重要的不是"酸葡萄",而是反转或飞跃的机会。

来源:爱生活的阿土伯

相关推荐