摘要:比如特斯拉的Optimus不仅有自研的SOC芯片,还需要几十个线性或旋转的电机以及触觉传感器、单双目相机、激光雷达、超过20个自由度的灵巧手、以及高密度的电池组。
从众擎机器人的前空翻,到宇树机器人的侧空翻,再到波士顿动力的侧翻,每次点开人形机器人的整活视频,我们或许都会喊上一声wow~awesome!
但你有没有想过,为什么各家厂商最为内卷的都是人形机器人,而不是机器猫和机器狗?
这篇文章,将为你解答这个问题,并带你了解人形机器人的一切。
为什么是人形?
相比机器狗、轮式机器人和机械臂,人形机器人非常难造,成本也更高。
比如特斯拉的Optimus不仅有自研的SOC芯片,还需要几十个线性或旋转的电机以及触觉传感器、单双目相机、激光雷达、超过20个自由度的灵巧手、以及高密度的电池组。
最重要的是,人形机器人需要一个装有具身智能大模型的大脑,和控制整个运动系统的小脑,来让机器人能够像真正的人类那样,获得外界感知、运动和思考。
有人就问了,既然这么复杂,我们直接造四足机器狗不就好了,不仅可以搬东西,做陪伴,还能上天入地,多有意义?
达咩达咩,人形机器人看似复杂,但确是我们造机器人的唯一一条捷径。
首先,人形机器人天生适配人类环境。
由于地球上99.6%的物理设施都是为人类身体设计的,这也让人形机器人上楼梯、旋转门把手、开冰箱都不需要改造,人的形态直接无缝衔接。
除了生活中的简单场景,人形机器人在工具的使用上更是如鱼得水,毕竟我们所有的工具都遵循人体工程学原理,这也让人形机器人能够比机械臂更适应工厂牛马的打工节奏。比如在亚马逊仓库里,人形机器人直接操作叉车搬货,比改造货运专用机器人硬生生节省了85%的成本。
当然,这不是最重要的。无数研究表明,你的认知能力和你的身体形态相关,智能也不完全取决于脑子有多发达,身体与环境互动有时候同等重要(具身智能第一定律)。就像婴儿在能够直立行走后,由于视线扩大了50%,对物体距离的理解才开始加速。有实验也表明,在开门、上下楼梯的学习中,双足机器人就是比其他形态的学习速度快3倍以上。
这样来看,在学习效率上,人形机器人似乎就是最优解。
其次,人形机器人可以偷师人类这个最强“外挂”。
毕竟,人类的“运动生存经验包”已经进化了百万年,最关键的是,还有亿万计的人类运动视频数据可以供机器人来训练,简直就是天生的免费老师。
像英伟达,还根据人类运动数据,做了一个模拟仿真世界模型——Cosmos,在和现实世界一样的虚拟世界里模拟真实的物理环境来训练人形机器人,让机器人通过无限刷题更加理解物理定律、物体和语言文字,成为模仿人类界的“小镇做题家”。
而这一切,都离不开数以亿计的人类真实数据,这些数据就像是机器人的《五年高考和三年模拟》,不仅量大管饱,还无限逼近高考真题,保你在高考中感觉似曾相识,宾至如归。
第三,也是我认为最重要的一点,是在应用场景中能和我们无缝衔接。
比如递东西时肩膀的略微倾斜,就能让我们不自觉地伸手去接;比如机器人可以像人类一样倾斜头部并以1.2米/秒的步频走路时,你也会不自觉地认为面前的这个情绪价值拉满的机器人是“自家人”,配合度也能提升30%以上;就连商场里的小偷见到双足巡逻机器人都会绕道走,这样的威慑力,谁能有?
为什么会这样?归根结底,还是因为这些及其像人的动作,触发了我们大脑中情感共鸣的神经机制,让我们天然信任对面这台冷冰冰的机器,卸下防备之心,不再认为它是威胁。
所有的这些科学证据,让我们得出一个很重要的结论——我们制造人形机器人,并不是为了炫技、耍酷,也不仅仅是为了让机器人更像人,而是为了更好地解决它们在和外部世界互动、收集数据、以及融入人类社会时遇到的一些根本问题。
当机器人变为人类文明的一面镜子时,人形机器人反而成为了通向具身智能的捷径。
为什么这么难造?
对比工业机器人、服务陪伴机器人等形态成熟的机器人,人形机器人可不能说好造。
在人形机器人中,对比轮式机器人,又以通用人形机器人最为难造。毕竟通用人形机器人不仅有手有脚,能做高难度动作表演武术杂技,还有感知能力和决策能力,最重要的是能识别我们的情感,提供情绪价值。
也就是说,通用人形机器人,不仅可以像机械臂那样进行重复性工业制造,以及像服务机器人和轮式机器人那样提供餐饮、旅游、展馆、教育科研和医疗等辅助服务,更可以来到我们的家庭服务我们的生活。当一种类型的产品从B端全面走向C端,其中的想象空间,真的不可估量。
从硬件上来看,通用人形机器人几乎把我们人类的各种部位复刻了一遍。
比如芯片和AI算法对应大脑,旋转关节和线性关节对应关节和肌肉,摄像头和各种雷达对应眼睛,各种结构件对应骨骼,触觉传感器和灵巧手对应双手和皮肤,电池组对应消化供能系统等等等等。
在这么多零件中,最重要的是关节,因为数量最多,价值量也高,会直接影响机器人的成本和运动能力。目前机器人用的关节总共有两种,一种是旋转关节,主要用在手腕、膝盖这种关节处,结构上主要由电机和减速器构成,几乎所有的厂家都在用;而另一种线性关节更复杂,可以把旋转关节的旋转运动转化为直线运动,主要用于上臂、大腿和肘部,结构是电机和丝杠,成本也更高,只有少数厂商在使用。
其次是传感器。传感器是什么,大家可以理解成人的眼睛、耳朵、鼻子、皮肤等等,可以让机器人对我们的真实世界有感知和交互,包括摄像头、激光雷达、毫米波雷达这样的视觉传感器、麦克风阵列这样的听觉传感器、气味仪这样的嗅觉传感器、力传感器这样的触觉传感器等。
其中视觉传感器,相当于人类的眼睛,目前主流的是3D双目深度相机,和我们眼睛的原理类似,是机器人认识五彩斑斓世界的核心。
力传感器是机器人控制运动精度和灵活性的传感器,直接影响动作做的到不到位,包括检测关节电流和扭矩的传感器、脚踝和腕部的六轴力矩传感器等。
在力传感器中,还有一种可以感受到压力、拉力、剪切力、位移、角度、位置、霍尔和温度的触觉传感器,如果做成柔性材质就变成了电子皮肤,可以把感觉转化为电信号并传递到大脑,是不是和我们的神经系统原理十分相似?目前,特斯拉的Optimus就在手指上安装了触觉传感器,打个鸡蛋做个饭,可以说十分贤惠了。
最后,我们来讲讲灵巧手。
灵巧手,顾名思义对标的是人类的双手。其实我觉的,人手是身体上最为灵活的部位没有之一,毕竟人手有23个自由度,重量只有人的1/150,却承担了全身一半以上的运动功能,更是我们接触物理世界的主要渠道,甚至可以做一些很复杂的工作,比如我们打工人牛马敲键盘。目前特斯拉的第三代灵巧手已经实现了22个自由度,十分接近人类双手了。
当然,对于灵巧手来说,连接手指和电机的传动装置也很重要,毕竟我们不可能在手指的每个关节上都装上电机。目前,腱传动是用得最多的,也是最像人类的一种传动方式,可以拉动手指关节,实现手指弯曲运动。
说完了硬件,我们再来说说软件。
如果类比人类的神经中枢,机器人的软件也可以分为大脑和小脑。其中大脑是具身智能和通用人工智能的核心,可以对外界环境的感知进行理解和处理,并模拟人类的思维进行推理和决策,你可以理解成加强版的多模态大模型;而小脑主要是模仿人类进行复杂的运动控制、路径规划和步态平衡,并直接控制关节、电机运行,让躯干和四肢乖乖听大脑的话,实现上传和下达。
有人问了,这不就是一个机器人骨架加个大模型吗?其实并不是,准确来说这是人工智能加机器人,并且这里的人工智能根本不是大模型简单的一串代码,而是安装了专属“具身大模型”,可以通过传感器和环境进行交互及运动,甚至不断适应和改变环境的物理实体。也只有感知——认知决策——行动——反馈学习四个环节闭环了,才是我们所谓的“具身智能”。
我们再来说说小脑。之前机器人的小脑都是给他加一个动力学模型,你可以理解成把体育课和物理课的教材直接扔给机器人让他按照规矩行事,但我们知道这样来学的的话进步会很有限。直到AI大模型尤其是视觉模型技术的成熟,让机器人可以直接通过模仿和强化学习直接复刻我们人类本身的一切,这种镜像效应也让学习效率也大大加快,比如我在开头说的英伟达Cosmos平台,其中的一个功能就是通过海量模拟数据来训练小脑的运动控制能力。
对于人形机器人来说,为什么我觉得小脑最难,是因为人形机器人的自由度或者说关节太多了,而运动不仅仅是一个关节的事情,而是需要所有关节联动和配合,这也意味着控制难度指数级提高,这也是人形机器人最考验技术水平的赛道。当然就更别提机器人之间的配合和联动了,这意味着成百上千个运动、传动装置的丝滑配合,这样的一支高效的队伍,即便在人类社会都很难协调和指挥。
说了这么多,大家是不是有点知难而退了?虽然难造,但全球尤其是我们中国的机器人企业却在迎难而上。面对今年的人形机器人量产元年,以及2026年的应用元年,我国企业是如何领跑全球机器人竞赛的?
其中有两个致胜法宝,你一定要了解。
为什么处于爆发前夜?
前段时间,美国知名半导体研究机构SemiAnalysis发了一篇深度报告(《America Is Missing The New Labor Economy – Robotics Part 1》),其中的观点震惊了业界——似乎只有中国具备抓住机器人历史机遇的条件。
的确,无论在供应链还是成本上看,我们都比美国更加有优势。无论是手机、新能源汽车、无人机、锂电池还是光伏,我们每进入一个行业,都会迅速完善一整条产业链,并通过学习把别人的技术优势转化为我们的成本和应用优势,把规模效应发挥到极致。
而现在,我们完全可以把造手机和新能源汽车的经验用到机器人身上,甚至可以把造新能源汽车和手机的原材料和生产线用于制造人形机器人,那些新能源汽车工厂稍加改造,就可以变成机器人生产线。
比如锂电池厂可以直接生产电池作为机器人的能源,制造电动车电机的企业也可以把电机小型化作为机器人的关节,甚至主机厂可以直接对机器人进行总装和质检。这样的制造效率,也让2024年我国的机器人安装量超过了美、德、日三国的总和,市场份额更是站上了50%,并且高端机器人水平毫不逊色。
此外,互联网企业和车企的自动驾驶算法和数据,也可以直接移植给机器人进行训练,毕竟二者也都属于具身智能算法,用于人形机器人的小脑。如此海量的路况数据,稍加改造就可以变成机器人运动的导航和指南针。
从类型上来看,我国的人形机器人,主要是初创企业、互联网企业和车企在造。目前像宇树、智元、优必选这样的明星初创企业在整机技术上暂时领先,像小鹏、小米、比亚迪这样的车企在硬件制造上有优势,像BBAT、华为这样的互联网企业在大脑大模型上有优势。
看了这么多机器人,在最后,我想说的是随着机器人技术和大模型的不断发展,我们确实正在无限接近那个“人机合一”的具身智能技术奇点。人形机器人也不再只是冰冷机械的集合体,而是成为人工智能走向通用智能的桥梁。正如大脑需要身体来与世界交互、反馈并不断学习一样,机器人也需要一个“人类形态”的外壳去真正融入人类社会。
这不是一场简单的技术炫技,而是一场关于人类未来生活方式的深刻变革。只有当机器人能够像人类一样感知、理解、共情甚至自主决策、学习和适应之时,才能真正把底层技术创新和应用融合,走出实验室,成为我们生活、工作、情感世界中的“伙伴”,并最终和物理世界交融,实现AGI的美好理想。
未来已来,从“让机器人更像人”到“让机器人成为人”,虽然还有很长的路要走,但人形,一定是我们通向通用智能的必经之路。
参考文献:
人形机器人行业研究:人形机器人,从理想走进现实,国金证券
运动控制行业研究:人形机器人“小脑”有望成为主赛道,国金证券
人形机器人行业报告(六):机器人量产时刻,互动感知能力有望成为迭代重点,信达证券
人形机器人深度之五:国内机器人行业深度:量产元年,百家争鸣,东吴证券
人形机器人行业2025年度策略:人工智能的终极载体,量产在即开启十年产业大周期,东吴证券
计算机行业研究深度报告:具身智能:万亿赛道,落地元年,东吴证券
机器人系列报告一:具身智能:决定机器人泛化能力天花板的“大小脑”,中泰证券
人形机器人量产元年,关注三条主线:软件、最强本体与预期差品种,中泰证券
人形机器人2025年度投资策略:华章日新,竞启元年,国海证券
人形机器人行业研究报告:传感器,机器人感知核心,未来的星辰大海,西南证券
新技术前瞻专题系列(八):人形机器人专题(一):传感器的技术路径、竞争格局与产业重构,东兴证券
电子:从柔性传感到人形机器人触觉革命,华鑫证券
越像人类越难造!为什么资本都执着于造「人形」的机器人?,深蓝具身智能
英伟达对机器人下手了,远川研究所
领跑全球机器人竞赛!中国的两大制胜法宝:成本+供应链,华尔街见闻
来源:华安基金