智元机器人发布首个通用具身基座模型

摘要：智元机器人今天正式发布首个通用具身基座模型——智元启元大模型（Genie Operator-1），开创性提出Vision-Language-Latent-Action (ViLLA) 架构。

【环球网科技综合报道】3月10日消息，智元机器人今天正式发布首个通用具身基座模型——智元启元大模型（Genie Operator-1），开创性提出Vision-Language-Latent-Action (ViLLA) 架构。

据悉，该架构由VLM(多模态大模型) + MoE(混合专家)组成，其中VLM借助海量互联网图文数据获得通用场景感知和语言理解能力，MoE中的Latent Planner(隐式规划器)借助大量跨本体和人类操作视频数据获得通用的动作理解能力，MoE中的Action Expert(动作专家)借助百万真机数据获得精细的动作执行能力。

智元机器人方面表示，这三者环环相扣，实现了可以利用人类视频学习，完成小样本快速泛化，降低了具身智能门槛，并成功部署到智元多款机器人本体，持续进化，将具身智能推上了一个新台阶。

智元机器人方面称，GO-1大模型将加速具身智能的普及，机器人将从依赖特定任务的工具，向着具备通用智能的自主体发展，在商业、工业、家庭等多领域发挥更大的作用，通向更加通用全能的智能未来。（思瀚）

来源：环球网科技频道

标签：模型机器人通用基座 moe

本文地址：https://news.43u.com.cn/a/660412.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!