摘要:国泰君安发布研报称,智元发布首个通用具身基座模型智元启元大模型,GO-1大模型可泛化应用到各类的环境和物品中,快速适应新任务、学习新技能。同时,它还支持部署到不同的机器人本体,高效地完成落地,并在实际的使用中持续不断地快速进化,包括:1)从单一任务到多种任务;
智通财经APP获悉,国泰君安发布研报称,智元发布首个通用具身基座模型智元启元大模型,GO-1大模型可泛化应用到各类的环境和物品中,快速适应新任务、学习新技能。同时,它还支持部署到不同的机器人本体,高效地完成落地,并在实际的使用中持续不断地快速进化,包括:1)从单一任务到多种任务;2)从封闭环境到开放世界;3)从预设程序到指令泛化。GO-1大模型将加速具身智能的普及,在商业、工业、家庭等多领域发挥更大的作用,通向更加通用全能的智能未来,关注智元产业链的相关机会。
国泰君安主要观点如下:
智元发布首个通用具身基座模型Genie Operator-1
3月10日,智元发布首个通用具身基座大模型GO-1,开创性地提出了Vision-Language-Latent-Action (ViLLA) 架构,该架构由VLM(多模态大模型)+ MoE(混合专家)组成,其中VLM 借助海量互联网图文数据获得通用场景感知和语言理解能力,MoE 中的Latent Planner(隐式规划器)借助大量跨本体和人类操作视频数据获得通用的动作理解能力,MoE 中的Action Expert(动作专家)借助百万真机数据获得精细的动作执行能力,三者环环相扣,实现了可以利用人类视频学习,完成小样本快速泛化,降低了具身智能门槛,并成功部署到智元多款机器人本体,持续进化,将具身智能推上了一个新台阶。
GO-1:VLA进化到ViLLA
为了有效利用高质量的AgiBot World数据集以及互联网大规模异构视频数据,增强策略的泛化能力,智元提出了ViLLA这一架构。在推理时,VLM、Latent Planner和ActionExpert三者协同工作。其中LAM(隐式动作模型)主要用于获取当前帧和历史帧之间Latent Actions的Groundtruth(真值),它由编码器和解码器组成。Latent Planner负责预测这些离散的Latent ActionTokens,它与VLM主干网络共享相同的Transformer结构,同时引入Action Expert。结果显示,相比已有的最优模型,GO-1成功率大幅领先,平均成功率提高了32%(46%->78%)。
投资建议:重点关注国产机器人整机厂和零部件公司
包括:1)整机厂:受益标的为赛力斯(601127.SH)、东方精工(002611.SZ);2)执行器和电机:推荐标的兆威机电(003021.SZ),受益标的为三花智控(002050.SZ)、拓普集团(601689.SH)、伟创电气(688698.SH)、鸣志电器(603728.SH)、步科股份(688160.SH)。
3)减速器:受益标的为中大力德(002896.SZ)、双环传动(002472.SZ)、豪能股份(603809.SH)等;4)驱控类:受益标的为峰岹科技(688279.SH)、拓斯达(300607.SZ)。
5)传感器:推荐标的为东华测试(300354.SZ),受益标的为柯力传感(603662.SH)、奥比中光(688322.SH)、天准科技(688003.SH)。
6)丝杠类:推荐标的为恒立液压(601100.SH)、贝斯特(300580.SZ)和长盛轴承(300718.SZ),受益标的为北特科技(603009.SH)、五洲新春(603667.SH)和丰立智能(301368.SZ)等。
风险提示
国产设备替代进度不及预期风险、人形机器人产业化不及预期风险、产业政策不及预期风险。
来源:智通财经