摘要:曾以“华为天才少年”身份广受关注的彭志辉(稚晖君),今日携其创立的智元机器人,正式揭晓了引发全网热议的“神秘新品”——全球首个通用具身基座大模型Genie Operator-1(GO-1)。这一突破性技术不仅标志着具身智能迈向新高度,更预示着人机协作的范式革命
曾以“华为天才少年”身份广受关注的彭志辉(稚晖君),今日携其创立的智元机器人,正式揭晓了引发全网热议的“神秘新品”——全球首个通用具身基座大模型Genie Operator-1(GO-1)。这一突破性技术不仅标志着具身智能迈向新高度,更预示着人机协作的范式革命。
一、从预告到落地:一场技术革命的诞生
3月7日,稚晖君在微博以一句“下周智元机器人有好东西发布”点燃科技圈。短短三天,该话题阅读量超10万次,相关视频播放量突破1050万次,网友对其“神秘新品”的猜测达到顶峰。今日谜底揭晓:智元机器人正式推出ViLLA架构驱动的GO-1大模型,并同步宣布其通用具身机器人已量产下线1000台,覆盖工业与商业场景。
作为技术核心,GO-1的诞生背后是智元团队两年多的积累:
数据基石:依托2024年发布的全球最大机器人真机数据集AgiBot World(含100万条轨迹、217个任务);
技术迭代:从首款人形机器人“远征A1”(49自由度、200TOPS算力)到开源项目“灵犀X1”,智元逐步构建起“硬件-算法-生态”闭环。
二、技术解码:ViLLA架构如何颠覆具身智能?
GO-1的核心创新在于其Vision-Language-Latent-Action(ViLLA)架构,该架构通过**多模态大模型(VLM)+混合专家系统(MoE)**的协同,解决了机器人“感知-规划-执行”的断层难题。
1. 三层技术突破
感知层:基于5B参数开源多模态大模型InternVL-2B,整合多视角视觉、力觉信号与语言输入,实现场景深度理解;
规划层:引入隐式规划器(Latent Planner),通过跨本体视频学习预测隐式动作标记(Latent Action Tokens),将任务成功率提升12%;
执行层:采用扩散模型驱动的动作专家(Action Expert),实现每秒220个动作的高频精准操控。
2. 四大核心能力
人类视频学习:融合互联网视频与真实示范,理解复杂人类行为;
小样本泛化:仅需少量数据即可适应新场景,如“倒水”任务成功率从46%跃升至78%;
一脑多形:同一模型适配双足、四足、机械臂等不同机器人形态;
持续进化:通过数据回流系统,实时优化执行策略(例如修正咖啡杯放置偏差)。
三、产业影响:从实验室到商业化的跨越
智元机器人此次发布不仅是一次技术突破,更开启了具身智能的规模化应用:
工业场景:已量产的远征A2系列机器人可完成40kg重物搬运、柔性产线协作等任务,客户包括蓝思科技等制造巨头;
开源生态:灵犀X1机器人开源硬件设计与代码,吸引超50万开发者参与生态建设;
商业服务:GO-1支持的机器人可执行接待、物料分发等任务,未来将拓展至家庭场景。
与宇树科技聚焦消费级市场不同,智元选择“B端先行”战略,通过工业落地积累数据与技术势能。其股东阵容(比亚迪、红杉中国等)与70亿元估值,印证了资本对其技术路线的认可。
四、未来展望:2025机器人元年的“中国答案”
随着特斯拉Optimus、宇树H1等产品加速商业化,2025年被视为“具身智能元年”。智元GO-1的发布,为中国在这一赛道提供了三大启示:
技术路径:从专用模型转向通用基座,降低开发成本与门槛;
生态构建:通过开源与数据共享,推动行业协同创新;
场景延伸:从工业向医疗、教育等领域渗透,实现“机器人即服务”(RaaS)。
稚晖君在发布会中透露,智元将于未来数月推出基于强化学习的仿真模型及新一代人形机器人,进一步扩展技术边界。
结语
从华为天才少年到机器人创业先锋,稚晖君用GO-1大模型再次证明:中国创新者正重新定义AI与物理世界的交互方式。当具身智能走出实验室,成为千行万业的“数字劳动力”,这场由技术驱动的生产力革命,或许才刚刚开始。
来源:国货崛起了