摘要:3月8日,成都人形机器人创新中心发布最新阶段性成果:全国首个无需人工干预、无需遥控的自主完成跨空间人形机器人任务规划推理执行系统Raydiculous—1正式亮相。该系统在执行大空间和跨空间任务中拥有长视野(Long Horizon)推理规划能力,同时具备自主
2025 年政府工作报告明确指出,要大力推动智能网联新能源汽车、人工智能手机和电脑、智能机器人等新一代智能终端,以及智能制造装备的发展。
3月8日,成都人形机器人创新中心发布最新阶段性成果:全国首个无需人工干预、无需遥控的自主完成跨空间人形机器人任务规划推理执行系统Raydiculous—1正式亮相。该系统在执行大空间和跨空间任务中拥有长视野(Long Horizon)推理规划能力,同时具备自主学习、处理跨场景任务的特性。是人形机器人“实用性”的一次大的提升。更标志着“成都造”人形机器人在“大脑”构建中的突破。
“智能机器人的核心在于‘智能’,以此为基础,它才能深度融入并赋能人类生产生活的各个层面。这样的机器人,才是真正能够为人类高效工作,具备产业化价值的机器人。”成都人形机器人创新中心相关负责人表示,如在家庭场景下,智能机器人需要充分展现其自主性,它可以自行巡视全屋,及时关掉忘记关闭的台灯,为宠物添加食粮,有条不紊地整理客厅与卧室等区域;工业场景中,机器人能够自主完成各项非结构化任务,跨车间进行设备检修,与人类工程师顺畅“沟通”等。
“当机器人不再需要人类‘手把手’遥控指挥,才是真正的人形机器人的产业化临界点。”成都人形机器人创新中心的研发人员表示,人形机器人各种视频的传播让很多人认为人形机器人已经无所不能,但现实是,大脑技术没有实质性突破,人形机器人就一直停留在遥控层面。因此,人形机器人产业化的前提条件就是有一个聪明的”大脑“:一个简单的拿饮料的指令给到后,机器人能自主去厨房冰箱里拿饮料并给到给到坐在客厅沙发上的你。这在人形机器人实际的技术水平上仍然是需要突破的。
“目前,在单一人形机器人研发方面有两大推理执法技术框架。”该研发人员表示,一是基于算力驱动的大力出奇迹技术路径,即视觉-语言-动作模型VLA:利用单个模型实现机器人任务执行端到端,数据量大,需要算力支撑大,依赖云端实时性差。代表厂商有Figure等依靠Open AI大算力支持的团队。二是基于3DSGs和长视野任务规划:非单一端到端模型,使用VSLAM导航+调用感知和执行所需系列小模型,实现端上推理,数据量小,算力需求量小,实时性强。
成都人形机器人创新中心没有采取VLA“大力出奇迹”的技术路径,选择了一条“小而灵敏”的路径。“用‘根技术创新’取代‘算力堆叠’,这是人形机器人技术的突破。”成都人形机器人创新中心的研发人员表示,与空间里面完成任务相比,成都人形机器人创新中心通过贡嘎机器人实现长视野(Long Horizon)推理规划和自主学习跨场景任务执行,让机器人的“思考半径”扩大了很多。长视野推理规划可以让人形机器人自主规划行动路径,并在执行任务中实时推理——不仅能识别桌椅、门廊等物体,更能理解“厨房”、“卧室”等空间逻辑,甚至预判移动过程中可能发生的环境变化。这相当于让机器人从“背台词的话剧演员”进化为“即兴发挥的戏剧大师”。
2025年3月8日,成都人形机器人创新中心新的阶段性成果:全国首个无需人工干预、无需遥控的自主完成跨空间人形机器人任务规划推理执行系统正式亮相。这不仅在欧美团队采用的对算力强依赖的端到端VLA架构之外验证了新的基于3DSGs技术路径,更标志着“成都造”人形机器人在人形机器人“大脑”中的突破。
两周前,美国Figure公司展示了其机器人在“单一空间”的机器人任务推理执行系统,引起业内巨大反响。本周,成都人形机器人创新中心发布的基于 3DSGs 实现了“跨空间” 人形机器人规划推理执行。该系统在执行大空间和跨空间任务中拥有长视野(Long Horizon)推理规划能力,同时具备自主学习、处理跨场景任务的特性。是人形机器人“实用性”的一次大的提升。
从“遥控玩具”到“家庭伙伴”:一场关于自主性的技术革命
“当机器人不再需要人类‘手把手’遥控指挥,才是真正的人形机器人的产业化临界点。”成都人形机器人创新中心的研发人员说道,“用遥控方式实现人形机器人的跑跑跳跳是大众对人形机器人目前阶段的认知。但如何让机器人自主流畅完成一个任务却是人形机器人产业方向上需要突破的。人形机器人各种视频的传播让很多人认为人形机器人已经无所不能,但现实是,大脑技术没有实质性突破,人形机器人就一直停留在层面。因此,人形机器人产业化的前提条件就是有一个聪明的”大脑“:一个简单的拿饮料的指令给到后,机器人能自主去厨房冰箱里拿饮料并给到给到坐在客厅沙发上的你。这在人形机器人实际的技术水平上仍然是需要突破的。
与在单一空间里面完成任务相比,成都人形机器人创新中心通过贡嘎机器人实现长视野(Long Horizon)推理规划和自主学习跨场景任务执行,让机器人的“思考半径”扩大了很多。长视野推理规划可以让人形机器人自主规划行动路径,并在执行任务中实时推理——不仅能识别桌椅、门廊等物体,更能理解“厨房”、“卧室”等空间逻辑,甚至预判移动过程中可能发生的环境变化。这相当于让机器人从“背台词的话剧演员”进化为“即兴发挥的戏剧大师”。
“智能≠蛮力:“成都造”方案破解“算力困局”
人形机器人两大推理执法技术框架:
1.基于算力驱动的大力出奇迹技术路径,即视觉-语言-动作模型VLA: 利用单个模型实现机器人任务执行端到端,数据量大,需要算力支撑大,依赖云端实时性差。代表厂商有Figure等依靠Open AI大算力支持的团队。
2.基于 3DSGs和长视野任务规划:非单一端到端模型,使用VSLAM导航+调用感知和执行所需系列小模型,实现端上推理,数据量小,算力需求量小,实时性强。
面对全球AI竞赛中“堆算力、卷数据”竞赛,成都人形机器人创新中心没有采取VLA“大力出奇迹”的技术路径,选择了一条“小而灵敏”的路径。“用‘根技术创新’取代‘算力堆叠’,这是人形机器人技术的突破。”成都人形机器人创新中心的研发人员说道。
从实验室到千家万户:重新定义“生产力革命”
《2025 年国务院政府工作报告》明确指出,要大力推动智能网联新能源汽车、人工智能手机和电脑、智能机器人等新一代智能终端,以及智能制造装备的发展。
智能机器人绝非跑跑跳跳的遥控玩具,而是驱动新质生产力的强劲引擎。如在家庭场景下,智能机器人需要充分展现其自主性,它可以自行巡视全屋,及时关掉忘记关闭的台灯,为宠物添加食粮,有条不紊地整理客厅与卧室等区域;工业场景中,机器人能够自主完成各项非结构化任务,跨车间进行设备检修,与人类工程师顺畅 “沟通”等。
智能机器人的核心在于 “智能”,以此为基础,它才能深度融入并赋能人类生产生活的各个层面。这样的机器人,才是真正能够为人类高效工作,具备产业化价值的机器人。
深圳市科技创新局关于印发《深圳市具身智能机器人技术创新与产业发展行动计划(2025-2027年)》的通知中明确指出:“构建具备交互、预测与决策能力的具身智能基座大模型及其训练、推理技术体系,形成长序列推理(COT)和自主学习能力,支持跨场景任务处理。”成都人形机器人创新中心今天发布的成果就已经实现了上述要求。
当机器人真正具备理解、思考、推理能力后,才会真正带来人类生产生活方式的颠覆性变革。成都人形机器人创新中心持续聚焦人形机器人“大脑”的核心技术攻关,随着技术难关的不断攻克,人形机器人将会越来越“聪明”,产品的实用性、行业的产业化将成为可能。
来源:中国网