DeepSeek掀桌，能让机器人“看穿”世界吗？

摘要：如果说以OpenAI为代表的大语言模型进一步催化了具身智能的发展，那么DeepSeek的出现，对于具身智能行业来说又意味着什么？倘若DeepSeek能够用十分之一的成本达到GPT-o1级别的表现，那一直以来困囿于训练成本高昂的具身智能企业，是否有机会用更短的时

蛇年春节前夕，人工智能公司DeepSeek“破圈”。这家来自中国的初创公司凭借低成本的训练方式“掀翻”了全球人工智能市场的牌桌。

如果说以OpenAI为代表的大语言模型进一步催化了具身智能的发展，那么DeepSeek的出现，对于具身智能行业来说又意味着什么？倘若DeepSeek能够用十分之一的成本达到GPT-o1级别的表现，那一直以来困囿于训练成本高昂的具身智能企业，是否有机会用更短的时间训练出一个更智能、更通用的具身智能大模型？

DeepSeek的出现，也许正在重构具身智能行业的竞争规则。

有望消弭机器人的认知“大雾”

DeepSeek的“横空出世”或许给出了具身智能行业新的解法和思路。高工机器人产业研究所所长卢瀚宸向第一财经记者表示，结合当前国内具身智能和人形机器人的痛点和短板，从当前的定位和目标来看，DeepSeek是有望在基础模型和前沿创新领域带来颠覆性影响的。

“DeepSeek的推理能力有机会加快机器人决策和响应的进程。”萨摩耶云科技集团AI机器人研究员郑扬洋告诉第一财经记者，DeepSeek的推理能力使得机器人不仅能够看到物体，更能够理解更深层次的意图与背景信息。“这意味着机器人看到和理解之间的大雾也许正在消失。”

根据目前披露的数据，DeepSeek-R1在三维空间推理表现出87.6%的准确率，并在跨模态意图理解方面达到了91.2%的F1值。“DeepSeek的开源模型和详细技术报告的提供，有助于其他研究人员和工程师快速验证和拓展该方法，从而推动通用机器人大模型的发展。”郑扬洋认为，随着国产厂商追赶一线模型的训练成本将大幅下降，国产机器人有望通过更低的成本推动行业通用大模型的成熟。

算力和成本，一直以来都是横亘在具身智能大模型发展路径中的两座大山。“大算力是机器人计算平台不可或缺的关键能力。”一位具身智能企业的技术人员向第一财经记者表示，现行传统域控制器的算力在几TOPS到几百TOPS不等，“上千TOPS甚至更多的平台是少数”。

如果不能在降低成本的同时提高算力，机器人的落地仍然会有问题。“如果机器人在半结构化的流水线上，因为算力不够导致操作延迟，进一步造成了失误，它所带来的后果和风险都是企业不愿意看到的。”上述技术人员说道。

因此，DeepSeek近乎颠覆性的验证，也似乎给具身智能行业也带来了更多希望：算力、算法、成本的创新，都有机会重新书写游戏规则。

幻觉仍然存在

第一财经记者试图让DeepSeek这个AI界的新贵锐评一下当前全球具身智能市场中的巨头，在经过两次深度思考，总计用时26秒之后，第一财经记者看到了这个也许是世界上最聪明的AI之一，对于波士顿动力、特斯拉等企业的看法。

以下是DeepSeek给出的“毒舌”点评。

对于老牌机器人企业波士顿动力，DeepSeek说它是“技术殉道者的行为艺术”，并辣评“十年练就‘后空翻信仰’，工业界却只问‘能搬几箱货’？”“ 被现代汽车当AI花瓶供养，韩国高管看Atlas的眼神像看电子貔貅”。

DeepSeek显然“深谙”波士顿动力“起个大早赶个晚集”的商业痛点。2021年，在谷歌、软银之后，波士顿动力被卖给韩国现代汽车。七年间易主三次，作为1992年就成立的机器人企业，波士顿动力的命运一波三折。

尽管早就秀出了机器人的“后空翻”能力，但经过了液压改电驱的技术战略巨变之后，波士顿动力的商业化进程明显落后。在机器狗领域，根据高工机器人产业研究所（GGII）数据，超过69%的全球市场份额已经被“后来者”宇树科技占领。

对于特斯拉的Optimus，DeepSeek则锐评它是“钢铁侠的赛博义肢”，称“马斯克承诺‘机器人比车早量产’，结果Cybertruck都生锈了Optimus还在跳机械舞”“被曝90%动作靠远程操控，堪称全球最贵提线木偶”。

2024年，Optimus 依旧是全球具身智能市场的明星：“蒙眼”爬坡、跟随音乐跳舞、和金·卡戴珊同框互动，马斯克也不断放出量产和降本的消息刺激市场，但DeepSeek显然“看穿”了它的弱点。

“提线木偶”就是Optimus的困境具象化。在每一次“里程碑式的突破”背后，常常能够看到Optimus工程师在背后的补充解释。去年11月，在特斯拉放出的视频中，Optimus机器人稳稳地接住了迎面而来的网球。特斯拉工程师米兰·科瓦克表示视频演示是在实验室中通过实时远程操作进行的。在10月特斯拉“We, Robot”发布会中，也有消息称有员工远程控制了Optimus机器人原型的部分功能。

在DeepSeek给出的海外具身智能巨头名单中，还有Figure AI和英伟达Project GR00T，DeepSeek分别点评其为“硅谷新晋PUA大师”和“黄仁勋的算力霸凌”。而国内企业方面，达闼、蔚来汽车人形机器人、大疆教育机器人、腾讯Robotics X等也出现在了DeepSeek的辣评名单中。

在这份名单中，DeepSeek并没有点评同为新贵的宇树科技，经过记者的第三次提问，DeepSeek给出了它对宇树科技的评价——“四足机器人界拼多多”。针对宇树机器人和机器狗便宜、开放C端销售的商业模式，DeepSeek给出的点评是“把波士顿动力Spot价格砍到脚踝，直播间喊出‘9块9上链接’的气势”“用消费电子套路玩B端产品，淘宝客服比工程师更懂机器人参数”。

不过，相比大语言模型，具身智能所需要的通用大模型侧重点有所不同。大语言模型的影响，需要多久才能传导至具身智能的价值链，仍然是一个未知数。

灵初智能联合创始人陈源培向第一财经记者表示，具身智能的通用大模型强调机器人和物理世界的交互，需要将感知、认知、和行动能力结合，对大模型的精确性要求更高。“就机器人落地门槛来说，部分情况下，哪怕是99%的正确率都不够，机器人需要99.99%甚至更高的成功率。”

但对于DeepSeek和其他的大语言模型来说，“幻觉”仍然存在。有用户反应，DeepSeek回答提问时列出的参考文献并非真实存在。

“但DeepSeek当前的出现仍然是一个积极的信号。”卢瀚宸表示，这也给国内的AI企业更多的创新的信心和勇气。“就像心理学中的吉格勒定理，如果从一开始心中就怀有高远的目标，就会呈现出与众不同的眼界，逐渐形成良好的工作习惯和方法，让每一步都朝着正确的方向前进。”卢瀚宸说道。