机器人又升级,“六一”前夕海淀企业发布产品级端到端导航大模型

360影视 日韩动漫 2025-06-01 19:58 2

摘要:在2025年“六一”儿童节前夕,一段机器狗在超市里灵活陪母子逛街、提包携物、于人流中穿梭自如的视频,在社交平台传播。“不靠遥控也能自己跟着人走?”这段视频不是摆拍,而是一项刚刚发布的前沿技术成果。银河通用正式推出自主研发的产品级端到端导航大模型——TrackV

新京报讯(记者吴为)在2025年“六一”儿童节前夕,一段机器狗在超市里灵活陪母子逛街、提包携物、于人流中穿梭自如的视频,在社交平台传播。“不靠遥控也能自己跟着人走?”这段视频不是摆拍,而是一项刚刚发布的前沿技术成果。银河通用正式推出自主研发的产品级端到端导航大模型——TrackVLA,一款具备纯视觉环境感知、语言指令驱动、可自主推理、具备零样本(Zero-Shot)泛化能力的具身大模型,让机器人“满大街跑”的想象从电影走进现实。记者从中关村科学城管委会获悉,今年以来,海淀区多项政策推动人形机器人与具身智能领域产业发展。

“海淀区内已经集聚具身智能企业297家、人形机器人整机企业22家,拥有一批国内外知名专家和学者。”记者从中关村科学城管委会获悉,中关村今年还发布了人形机器人的十大典型落地场景,我国人形机器人产业正从“单点突破”进入“生态共建”的新阶段。

机器狗视频。受访者提供

记者获悉,TrackVLA 是银河通用推出的产品级导航大模型,纯视觉环境感知、自然语言指令驱动、端到端输出语言和机器人动作,是一个由仿真合成动作数据训练的“视觉-语言-动作”(Vision-Language-Action, VLA)大模型。它让机器人拥有“听→看→懂→走”的闭环运动能力。一双眼睛看世界、一个智能“大脑”做推理,无需提前建图、无需摇操控制,真正实现语言驱动、泛化感知、自主推理、智能交互与运动。

传统机器人通常以“指令理解→环境感知→目标识别→路径规划”模块化的形式单独处理分解的子任务,有的甚至还要对工作环境提前构建地图,而TrackVLA把这些能力通过一个统一的模型完成。

研发人员介绍,TrackVLA用一个大模型集成了感知能力、推理能力、运动能力和交互能力。可在复杂工作环境中清晰辨明服务对象,提供智能专属服务,从而实现产品级的交互体验。TrackVLA让机器人不再需要提前建图,而是像人一样可以在不同环境中自主导航。哪怕是没见过的商场、电梯、游乐区,它都能像人类一样依靠模型内嵌的环境理解知识“现学现走”。

“从陪伴儿童到守护老人,从商场巡逻到室内物流,机器人在泛服务场景中的应用路径已经被银河通用带到公众面前。具身智能真正具备了‘看得懂、想得明白、动得起来’的一体化能力——即由视觉感知(眼)、智能决策(脑)到物理执行(腿)的全链路闭环,为具身大模型走向现实世界奠定了通用能力基础。”银河通用有关研发人员介绍。

编辑 张树婧

校对 张彦君

来源:新京报

相关推荐