中信建投:Figure、1X新品发布,模型迭代加速人形机器人商业化落

360影视 2025-02-25 01:28 1

摘要:本周机器人行业新品连发,①Figure发布搭载了Helix VLA模型的新品,该模型可以从VLMs中提取常识性知识,并将其转化为可泛化的机器人控制指令,使得人形机器人的学习效率大为提升,在多个领域实现了第一。②1X发布NEO GAMMA,在人工智能、设计、硬件

本周机器人行业新品连发,①Figure发布搭载了Helix VLA模型的新品,该模型可以从VLMs中提取常识性知识,并将其转化为可泛化的机器人控制指令,使得人形机器人的学习效率大为提升,在多个领域实现了第一。②1X发布NEO GAMMA,在人工智能、设计、硬件等方面进行了全面升级,灵巧手采取腱绳结构,外皮肤覆盖尼龙材料,更适合家庭使用。我们认为模型迭代、供应链降本,正加速人形机器人商业化落地,预计板块行情继续。

一、Figure:发布VLA模型Helix,泛化能力加速机器人通用化发展

Figure是美国领先的人形机器人初创公司

Figure成立于2022年5月,由创始人Brett Adcock创立,总部位于美国加利福尼亚州。Figure通过AI和机器人技术的融合,打造通用型人形机器人。2023年5月,Figure完成第一轮融资,筹得7000万美元;2023年10月,Figure发布机器人Figure01双足站立行走的视频,展示其在人形机器人领域的初步成果。2024年1月,Figure发布Figure01使用胶囊咖啡机制作咖啡的视频引起各方关注;2月,Figure在新一轮融资中获得英伟达、亚马逊、微软等公司约6.75亿美元的融资;3月,Figure发布首个OpenAI大模型加持的机器人Demo;8月,Figure发布第二代人形机器人Figure02,在软硬件方面持续提升。2025年2月4日,Brett Adcock宣布,Figure决定终止与OpenAI合作,称在全自主研发的、完全端到端机器人AI方面取得了重大突破,并将在未来30天内展示“人形机器人上从未见过的东西”。2025年2月20日,Figure推出其自研的VLA(Vision-Language-Action,视觉-语言-动作)模型Helix,在视频中展示了两个人形机器人协同工作的场景。

Helix模型具有诸多进步性意义,解决攻克机器人领域多个难题

Helix是一款通用的VLA模型,将感知、语言理解和学习控制相结合,攻克了机器人领域长期存在的多个难题。Helix创造了多项第一:

①全上半身控制:Helix是首个能够对人形机器人的整个上半身(包括手腕、躯干、头部和单个手指)进行高速率连续控制的VLA模型。

②多机器人协作:Helix是首个能同时在两台机器人上运行的VLA模型,使它们能够协作解决从未见过的物品相关的长期操纵任务。

③抓取任何物品:配备Helix模型的Figure机器人现在几乎可以抓取任何小型家用物品,包括数千种它们从未接触过的物品,只需按照自然语言指令操作即可。

④单一神经网络:与以往方法不同,Helix使用单一神经网络权重集来学习所有行为,如物品的抓取和放置、使用抽屉和冰箱以及机器人间的交互,且无需针对特定任务进行微调。

⑤商业化落地就绪:Helix是首个完全在嵌入式低功耗GPU上运行的VLA模型,可立即投入商业应用。

Helix首创“系统1、系统2”架构的VLA模型,相比传统方法具有显著优势

Helix首创的“系统1、系统2”与传统方法存在区别。以往方法存在一个根本性的权衡问题,VLM骨干网络通用性强,但速度较慢;而机器人视觉运动策略速度快,但通用性不足。而Helix通过两个相辅相成的系统解决了这一权衡问题,这两个系统经过端到端训练以实现交互:其中系统2(S2)是在7-9Hz频率下运行的经互联网预训练的VLM,用于场景理解和语言理解,并能够在不同物体和环境中实现广泛的泛化;系统1(S1)是可以快速反应的视觉运动策略,能以200Hz的频率将S2产生的潜在语义表示转化为精确的连续机器人动作。这种解耦架构使每个系统都能在最佳时间尺度上运行,S2可以在高层次目标上“慢思考”,而S1可以“快速思考”以实时执行和调整动作。

Helix的设计为其带来了以下几点关键优势:

①高速和泛化能力:Helix在速度上与专门的单任务行为克隆策略相当,同时能够零样本泛化到数千种新的测试物体上。

②可扩展性:Helix直接为高维动作空间输出连续控制指令,避免了以往VLA方法中复杂的动作标记方案。

③架构简单:Helix采用标准架构,系统2使用开源、开放权重的VLM,系统1采用简单的基于transformer的视觉运动策略。

④关注点分离:将S1和S2解耦,使得能够分别对每个系统进行迭代。

Helix展现出强大的泛化能力,模型训练效率极高

机器人完成零样本协作,彰显Helix强大的泛化能力。在Figure展示的视频中,两个Figure人形机器人成功完成了对全新的杂货物品的整理,这些物品并未在训练中出现,这展现出了Helix对于不同形状、大小和材料的强大泛化能力。并且两个机器人使用相同的Helix模型权重(系统2为70亿参数,系统1为8000万参数),无需针对特定机器人进行训练或明确分配角色。

Helix模型训练仅用极少的资源实现优异的泛化效果。Figure表示,总共使用约500小时的高质量监督数据对Helix进行训练,这仅占以前收集的VLA数据集规模的一小部分(不到5%),并且无需依赖多机器人实体收集或多个训练阶段,明显降低机器人训练数据量,模型训练效率极高。

人形机器人大脑泛化能力及训练效率提升,有助于加速人形机器人走向通用化应用

家庭场景对机器人来说是重大的挑战,由于家中物品繁多,其形状、大小、颜色和质地各异且难以预测,因此当人形机器人落地C端场景,需要其具备按需产生智能的行为,这对机器人大脑的泛化能力提出了较高的要求。而Helix提出的方案,在较少的训练数据下,展现出了极强的泛化能力,训练效率显著提升,有助于人形机器人的通用化发展,有望加速其在to C场景下的落地应用,利好板块的发展前景。

二、1X:新品NEO GAMMA推出,家庭适配性提升明显

2月22日1X发布NEO GAMMA人形机器人,在前一代NEO BETA的基础上实现了全面升级,更适合家庭使用,为开启家庭内部测试铺平道路。我们认为看点主要有三,①AI的全面升级:一方面,全身控制器的改进使得NEO GAMMA能够完成蹲下捡起物品、坐在椅子上保持平衡等难度较高动作;另一方面,1X自主训练的新型视觉操作模型能够在未见过的新环境进行预测,实现抓取物体等动作;②腱绳的应用:NEO Gamma配备了1X的肌腱驱动技术,将腱绳用于关节驱动,并包裹在软性覆盖物中以减少对周围环境的冲击并提高整体安全性;③尼龙材料的应用:NEO的针织服和鞋子采用耐用且柔软的尼龙材料,采用独特的全成衣无缝编织工艺,使面料能够贴合NEO而不影响其性能。研发及产业化进展方面,2025年公司持续推进“NEO In Your Home”私人抢先体验计划,后续将逐步向普通大众开放。

具体的升级主要包括人工智能、设计、硬件三方面:

(1)人工智能升级:①多功能全身控制器:通过从人类动作捕捉数据中使用强化学习获取动态控制技能,NEO现在能够以100Hz的频率运行,以自然的人类步态和手臂摆动行走,蹲下捡起地面的物品,并坐在椅子上,同时保持平衡。②通用操作能力改进:1X训练了一个视觉操作模型,利用经训练的神经网络,NEO GAMMA可以直接从原始传感器数据中预测远程操作的动作,能够在不同场景中抓取各种物体,包括在训练过程中未见过的环境。③自主开发语言模型:NEO Gamma的伴侣功能集整合了一个新的1X自主开发内部语言模型,能够实现自然对话和肢体语言,实现更人类友好的用户交互,贴近日常生活。

(2)设计改进:①消费者友好型设计:NEO Gamma配置Emotive耳环,能够提供实时视觉反馈,以改善沟通效果,并采用极简主义的设计美学,完美融入家庭环境。②外观设计:NEO的针织服和鞋子采用耐用且柔软的尼龙材料,通过日本岛精机制作所(Japanese Shimaseki machine)设备的3D打印技术制成。服装采用独特的全成衣无缝编织工艺,使面料能够贴合NEO而不影响其性能。③安全性提升:NEO Gamma配备了1X的肌腱驱动技术用于关节驱动,并包裹在软性覆盖物中以减少对周围环境的冲击并提高整体安全性。

(3)硬件升级:①更安静、更可靠:NEO GAMMA的硬件可靠性提高了10倍,噪音降低了10分贝,运行噪音已与冰箱相当。②音频体验升级:NEO GAMMA配备四个麦克风(前后左右),具备波束成形和回声消除功能,确保音频捕捉清晰无误。此外还配备了三扬声器系统——一个位于胸部,用于人工智能语音交互,以及两个位于骨盆部位的外向扬声器,用于低音、360度音效和音乐播放。

三、投资建议

机器人行业新品连发,Figure搭载Helix VLA模型的新品、1X新一代产品NEO GAMMA均体现出大模型端在人形机器人硬件上的进一步迭代,改进了对未知场景的预测性反应。我们认为模型迭代、供应链降本,叠加新材料的应用,正在加速人形机器人商业化落地,预计板块行情继续。

1)宏观经济和制造业景气度下滑风险:人形机器人产业链公司受宏观经济波动影响较大,行业与宏观经济波动的相关性明显,尤其是和工业制造的需求、基础设施投资、家庭经济情况等宏观经济重要影响因素强相关。若未来国内外宏观经济环境发生变化,下游行业投资放缓,将可能影响人形机器人产业链的发展环境和市场需求。

2)供应链波动风险:受全球宏观经济、贸易战、自然灾害等影响,若原材料紧缺,芯片等关键物料供应持续出现失衡,将引起人形机器人零部件制造业厂商生产成本增加甚至无法正常生产,经营业绩可能会受影响。

3)研发进展不及预期风险:目前,人形机器人领域研发仍然面临较多的困难和不确定性。

吕娟:董事总经理,研委会副主任,上海区域总监,高端制造组组长,机械行业首席分析师。复旦大学经济学硕士,法国 EDHEC 商学院金融工程交换生,河海大学机械工程及自动化学士,2007.07-2016.12 曾就职于国泰君安证券研究所任机械首席分析师, 2017.01-2019.07 曾就职于方正证券研究所任董事总经理、副所长、机械首席分析师。曾获新财富、金牛、 IAMAC、水晶球、第一财经、 WIND 最佳分析师第一名。2021年新财富最佳分析师机械行业第二名。

籍星博:中信建投证券机械行业分析师。同济大学管理学硕士、工学学士。2022年入职中信建投证券,专注于船舶港机、光伏设备、检测服务等领域的研究。

证券研究报告名称:《自动化设备:Figure、1X新品发布,模型迭代加速人形机器人商业化落地——2025年机器人行业系列报告之二》

对外发布时间:2025年2月23日

报告发布机构:中信建投证券股份有限公司

来源:点滴财学

相关推荐