机器人又升级，“六一”前夕海淀企业发布产品级端到端导航大模型

摘要：在2025年“六一”儿童节前夕，一段机器狗在超市里灵活陪母子逛街、提包携物、于人流中穿梭自如的视频，在社交平台传播。“不靠遥控也能自己跟着人走？”这段视频不是摆拍，而是一项刚刚发布的前沿技术成果。银河通用正式推出自主研发的产品级端到端导航大模型——TrackV

新京报讯（记者吴为）在2025年“六一”儿童节前夕，一段机器狗在超市里灵活陪母子逛街、提包携物、于人流中穿梭自如的视频，在社交平台传播。“不靠遥控也能自己跟着人走？”这段视频不是摆拍，而是一项刚刚发布的前沿技术成果。银河通用正式推出自主研发的产品级端到端导航大模型——TrackVLA，一款具备纯视觉环境感知、语言指令驱动、可自主推理、具备零样本（Zero-Shot）泛化能力的具身大模型，让机器人“满大街跑”的想象从电影走进现实。记者从中关村科学城管委会获悉，今年以来，海淀区多项政策推动人形机器人与具身智能领域产业发展。

“海淀区内已经集聚具身智能企业297家、人形机器人整机企业22家，拥有一批国内外知名专家和学者。”记者从中关村科学城管委会获悉，中关村今年还发布了人形机器人的十大典型落地场景，我国人形机器人产业正从“单点突破”进入“生态共建”的新阶段。

机器狗视频。受访者提供

记者获悉，TrackVLA 是银河通用推出的产品级导航大模型，纯视觉环境感知、自然语言指令驱动、端到端输出语言和机器人动作，是一个由仿真合成动作数据训练的“视觉-语言-动作”（Vision-Language-Action, VLA）大模型。它让机器人拥有“听→看→懂→走”的闭环运动能力。一双眼睛看世界、一个智能“大脑”做推理，无需提前建图、无需摇操控制，真正实现语言驱动、泛化感知、自主推理、智能交互与运动。

传统机器人通常以“指令理解→环境感知→目标识别→路径规划”模块化的形式单独处理分解的子任务，有的甚至还要对工作环境提前构建地图，而TrackVLA把这些能力通过一个统一的模型完成。

研发人员介绍，TrackVLA用一个大模型集成了感知能力、推理能力、运动能力和交互能力。可在复杂工作环境中清晰辨明服务对象，提供智能专属服务，从而实现产品级的交互体验。TrackVLA让机器人不再需要提前建图，而是像人一样可以在不同环境中自主导航。哪怕是没见过的商场、电梯、游乐区，它都能像人类一样依靠模型内嵌的环境理解知识“现学现走”。

“从陪伴儿童到守护老人，从商场巡逻到室内物流，机器人在泛服务场景中的应用路径已经被银河通用带到公众面前。具身智能真正具备了‘看得懂、想得明白、动得起来’的一体化能力——即由视觉感知（眼）、智能决策（脑）到物理执行（腿）的全链路闭环，为具身大模型走向现实世界奠定了通用能力基础。”银河通用有关研发人员介绍。

编辑张树婧

校对张彦君

来源：新京报

标签：导航模型机器人海淀端到端

本文地址：https://news.43u.com.cn/a/1889263.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!