摘要:如果说以OpenAI为代表的大语言模型进一步催化了具身智能的发展,那么DeepSeek的出现,对于具身智能行业来说又意味着什么?倘若DeepSeek能够用十分之一的成本达到GPT-o1级别的表现,那一直以来困囿于训练成本高昂的具身智能企业,是否有机会用更短的时
蛇年春节前夕,人工智能公司DeepSeek“破圈”。这家来自中国的初创公司凭借低成本的训练方式“掀翻”了全球人工智能市场的牌桌。
如果说以OpenAI为代表的大语言模型进一步催化了具身智能的发展,那么DeepSeek的出现,对于具身智能行业来说又意味着什么?倘若DeepSeek能够用十分之一的成本达到GPT-o1级别的表现,那一直以来困囿于训练成本高昂的具身智能企业,是否有机会用更短的时间训练出一个更智能、更通用的具身智能大模型?
DeepSeek的出现,也许正在重构具身智能行业的竞争规则。
有望消弭机器人的认知“大雾”
DeepSeek的“横空出世”或许给出了具身智能行业新的解法和思路。高工机器人产业研究所所长卢瀚宸向第一财经记者表示,结合当前国内具身智能和人形机器人的痛点和短板,从当前的定位和目标来看,DeepSeek是有望在基础模型和前沿创新领域带来颠覆性影响的。
“DeepSeek的推理能力有机会加快机器人决策和响应的进程。”萨摩耶云科技集团AI机器人研究员郑扬洋告诉第一财经记者,DeepSeek的推理能力使得机器人不仅能够看到物体,更能够理解更深层次的意图与背景信息。“这意味着机器人看到和理解之间的大雾也许正在消失。”
根据目前披露的数据,DeepSeek-R1在三维空间推理表现出87.6%的准确率,并在跨模态意图理解方面达到了91.2%的F1值。“DeepSeek的开源模型和详细技术报告的提供,有助于其他研究人员和工程师快速验证和拓展该方法,从而推动通用机器人大模型的发展。”郑扬洋认为,随着国产厂商追赶一线模型的训练成本将大幅下降,国产机器人有望通过更低的成本推动行业通用大模型的成熟。
算力和成本,一直以来都是横亘在具身智能大模型发展路径中的两座大山。“大算力是机器人计算平台不可或缺的关键能力。”一位具身智能企业的技术人员向第一财经记者表示,现行传统域控制器的算力在几TOPS到几百TOPS不等,“上千TOPS甚至更多的平台是少数”。
如果不能在降低成本的同时提高算力,机器人的落地仍然会有问题。“如果机器人在半结构化的流水线上,因为算力不够导致操作延迟,进一步造成了失误,它所带来的后果和风险都是企业不愿意看到的。”上述技术人员说道。
因此,DeepSeek近乎颠覆性的验证,也似乎给具身智能行业也带来了更多希望:算力、算法、成本的创新,都有机会重新书写游戏规则。
幻觉仍然存在
第一财经记者试图让DeepSeek这个AI界的新贵锐评一下当前全球具身智能市场中的巨头,在经过两次深度思考,总计用时26秒之后,第一财经记者看到了这个也许是世界上最聪明的AI之一,对于波士顿动力、特斯拉等企业的看法。
以下是DeepSeek给出的“毒舌”点评。
对于老牌机器人企业波士顿动力,DeepSeek说它是“技术殉道者的行为艺术”,并辣评“十年练就‘后空翻信仰’,工业界却只问‘能搬几箱货’?”“ 被现代汽车当AI花瓶供养,韩国高管看Atlas的眼神像看电子貔貅”。
DeepSeek显然“深谙”波士顿动力“起个大早赶个晚集”的商业痛点。2021年,在谷歌、软银之后,波士顿动力被卖给韩国现代汽车。七年间易主三次,作为1992年就成立的机器人企业,波士顿动力的命运一波三折。
尽管早就秀出了机器人的“后空翻”能力,但经过了液压改电驱的技术战略巨变之后,波士顿动力的商业化进程明显落后。在机器狗领域,根据高工机器人产业研究所(GGII)数据,超过69%的全球市场份额已经被“后来者”宇树科技占领。
对于特斯拉的Optimus,DeepSeek则锐评它是“钢铁侠的赛博义肢”,称“马斯克承诺‘机器人比车早量产’,结果Cybertruck都生锈了Optimus还在跳机械舞”“被曝90%动作靠远程操控,堪称全球最贵提线木偶”。
2024年,Optimus 依旧是全球具身智能市场的明星:“蒙眼”爬坡、跟随音乐跳舞、和金·卡戴珊同框互动,马斯克也不断放出量产和降本的消息刺激市场,但DeepSeek显然“看穿”了它的弱点。“提线木偶”就是Optimus的困境具象化。在每一次“里程碑式的突破”背后,常常能够看到Optimus工程师在背后的补充解释。去年11月,在特斯拉放出的视频中,Optimus机器人稳稳地接住了迎面而来的网球。特斯拉工程师米兰·科瓦克表示视频演示是在实验室中通过实时远程操作进行的。在10月特斯拉“We, Robot”发布会中,也有消息称有员工远程控制了Optimus机器人原型的部分功能。
在DeepSeek给出的海外具身智能巨头名单中,还有Figure AI和英伟达Project GR00T,DeepSeek分别点评其为“硅谷新晋PUA大师”和“黄仁勋的算力霸凌”。而国内企业方面,达闼、蔚来汽车人形机器人、大疆教育机器人、腾讯Robotics X等也出现在了DeepSeek的辣评名单中。
在这份名单中,DeepSeek并没有点评同为新贵的宇树科技,经过记者的第三次提问,DeepSeek给出了它对宇树科技的评价——“四足机器人界拼多多”。针对宇树机器人和机器狗便宜、开放C端销售的商业模式,DeepSeek给出的点评是“把波士顿动力Spot价格砍到脚踝,直播间喊出‘9块9上链接’的气势”“用消费电子套路玩B端产品,淘宝客服比工程师更懂机器人参数”。
不过,相比大语言模型,具身智能所需要的通用大模型侧重点有所不同。大语言模型的影响,需要多久才能传导至具身智能的价值链,仍然是一个未知数。
灵初智能联合创始人陈源培向第一财经记者表示,具身智能的通用大模型强调机器人和物理世界的交互,需要将感知、认知、和行动能力结合,对大模型的精确性要求更高。“就机器人落地门槛来说,部分情况下,哪怕是99%的正确率都不够,机器人需要99.99%甚至更高的成功率。”
但对于DeepSeek和其他的大语言模型来说,“幻觉”仍然存在。有用户反应,DeepSeek回答提问时列出的参考文献并非真实存在。
“但DeepSeek当前的出现仍然是一个积极的信号。”卢瀚宸表示,这也给国内的AI企业更多的创新的信心和勇气。“就像心理学中的吉格勒定理,如果从一开始心中就怀有高远的目标,就会呈现出与众不同的眼界,逐渐形成良好的工作习惯和方法,让每一步都朝着正确的方向前进。”卢瀚宸说道。
来源:第一财经