人形机器人产业与技术发展现状

360影视 欧美动漫 2025-03-26 09:21 3

摘要:人形机器人作为新一代人工智能的集大成者,已经成为全球科技和产业竞争的新高地。各国政府高度重视,从促进多方协同、加大研发投入、完善产业生态、重视人才培养、加强国际合作以及关注伦理安全等维度,出台了一系列政策措施,为本国的人形机器人产业发展提供强力支持。

2.1 产业发展现状与趋势

2.1.1 产业政策

2.1.1.1 全球产业政策特点

人形机器人作为新一代人工智能的集大成者,已经成为全球科技和产业竞争的新高地。各国政府高度重视,从促进多方协同、加大研发投入、完善产业生态、重视人才培养、加强国际合作以及关注伦理安全等维度,出台了一系列政策措施,为本国的人形机器人产业发展提供强力支持。

以中国、欧美、日韩地区为例,各国政府在技术创新与研究支持方面,集中资源推动核心技术的突破,包括人工智能、机器学习、机器人技术和人机交互等领域的研发,并为相关技术研究提供资金和政策支持;在市场拓展与应用推广方面,重点关注人形机器人在提升生产力、改善产品质量及缓解劳动力短缺等领域的实际应用,特别是在工业自动化、医疗与老龄化护理、商业服务等行业;在标准化方面,各国强调本国产业标准的制定与国际合作,以促进全球产业体系的兼容性和互操作性。

2)地方政策

自 2023 年以来,地方政府积极响应国家政策,出台支持人形机器人发展的措施,推动产业创新与升级。各地加大资金支持,助力技术攻关与产业链完善,鼓励企业与科研机构合作,推动核心技术突破和自主创新。政策重点推动人形机器人在工业、服务、医疗等领域的应用,拓展市场空间,加速产业化进程。

2.1.1.3 国外相关政策

机器人产业作为衡量国家科技创新与高端制造水平的重要标志,备受全球关注。主要经济体纷纷将机器人产业发展上升为国家战略,抢占科技和产业制高点,并相继出台多项政策,加速推动人形机器人行业发展。

2.1.2 全球产业格局

人形机器人作为全球科技竞争的新高地、经济发展新引擎以及未来产业发展的新赛道,展现出巨大的发展潜力和广阔的应用前景。它不仅是加快形成新质生产力、推动科技自立自强的重要支撑,也将深刻影响多个行业的变革。自 2022 年以来,全球人形机器人产业规模持续扩大,预计未来十年将继续保持高速增长的趋势。

目前,全球人形机器人产业的格局呈现出多元化、区域化和跨界融合的特点,其中中国、欧洲、北美、日本和韩国等地区在技术研发、企业培育和产业应用方面处于全球领先地位。特别是在工业制造、商业服务和家庭看护等领域,人形机器人已初步展现其巨大的市场价值。在这一进程中,全球涌现出一大批优质的整机企业。其中,中国、美国、日本和欧洲等国家和地区是全球人形机器人企业分布最为集中的区域,例如中国的优必选、宇树科技、傅里叶智能、小米等公司;美国的特斯拉、波士顿动力、Figure AI 等公司;日本的本田公司;欧洲的 Aldebaran Robotics SAS 公司(法国)、1X Technologies(挪威)等。这些企业的集中分布成为推动全球人形机器人产业发展的重要力量。

未来,随着人工智能、机器学习和机器人硬件技术的不断突破,人形机器人将持续提升智能化水平,为人类提供更加多元化的服务支持,进一步推动社会各行业的数字化转型和自动化进程。

与此同时,人形机器人产业的发展也面临诸多挑战,涉及技术创新、市场需求、标准化和伦理安全等方面。因此,全球各国、各地区以及行业企业需加强协作,推动跨界融合,解决技术与市场的问题,确保产业健康有序地发展。

2.1.3 产业链分析

2.1.3.1 总体情况

人形机器人上游产业链涵盖零部件和基础软件供应,包括电机、减速器、传感器、控制器、芯片,以及基础软件等核心技术支持;中游主要由整机系统制造商构成,负责机器人本体的研发设计、组装、测试和系统集成;下游聚焦于终端应用场景,覆盖工业制造、家庭服务、医疗康养、高危作业、教育培训等多个领域。

2.1.3.2 上游

1)核心零部件(硬件)

人形机器人本体的核心零部件包括感知器件、运动器件、灵巧手、芯片和动力模块,这些部件构成了机器人实现环境感知、精确控制和自主运行的关键基础。

感知器件——涵盖视觉、力/触觉和运动感知的多种传感器,例如视觉传感器、惯性传感器和力矩传感器,用于采集外部环境信息和机器人的自身状态数据;

运动器件——包括减速器、丝杠、电机及运动控制器等,负责驱动机器人完成精确、稳定的动作;

灵巧手——作为精细操作的关键部件,对结构设计、反馈系统和尺寸规格要求极高;

芯片——主要涵盖 CPU、GPU、NPU 等计算芯片和各类控制芯片,是机器人执行复杂算法和智能决策的“大脑”;

动力模块——包括电池、充电装置等,为整机提供可靠的能量支持。

目前,人形机器人核心零部件的国产化程度整体处于中等水平。部分关键零部件如无框力矩电机、T 型丝杠、滚珠丝杠和视觉传感器件有较高的国产化率,性能和性价比具备一定竞争力。然而,空心杯电机、高算力芯片、RV 减速器等高端核心部件仍高度依赖进口,这些领域存在明显的技术差距,国产化空间巨大。随着国内产业的快速发展,供应链体系正在逐步完善。一批优质供应商,如绿的谐波、步科股份、禾川科技、华为海思等,正在加速攻关关键技术,集中突破高精度减速器、高性能电机、高算力芯片等“卡脖子”领域,努力打破国外技术垄断,为实现自主可控的核心部件供应提供重要支撑。

未来,为推动人形机器人产业高质量发展,应加速制定上游核心零部件的技术标准,以提升国产化水平和全球竞争力。标准化不仅是实现模块化设计和部件互换性的关键,也是优化生产流程、提升系统集成效率的重要手段。统一的技术规范和接口标准将有效降低企业在研发和制造环节的成本,同时促进产业链上下游企业间的协同创新与资源整合,进一步优化供应链效率。同时,建立标准化体系并营造良好的技术创新环境,可以加速核心零部件的技术攻关与国产化进程,推动国内企业在高精度减速器、高性能电机、高算力芯片等关键领域实现突破,逐步摆脱对进口的依赖。与此同时,标准化建设将为我国企业在全球产业中树立技术标杆,提升国际话语权和市场竞争力。

2)基础软件

随着人形机器人技术的不断发展,其构型以及感知、控制、决策等能力日益复杂,基础软件体系也经历了从简单到复杂、从低级到高级的演变。

人形机器人基础软件逐渐涵盖了操作系统、核心算法、大模型及仿真软件等多个方面,且各环节的标准化已成为推动产业发展的关键。目前,操作系统的国产化程度中等,国际上以 ROS 为代表的开源操作系统为产业提供了通用框架,国内天鹤 OS 和 kaihongOS 等本土系统则聚焦场景化应用和生态连接,推动国产化进程;控制算法的国产化程度较高,国内企业可以自主研发人形机器人整机系统的核心算法,部分头部企业在核心算法领域展现出强大的研发实力,例如宇树科技、优必选等在步态规划、视觉识别、平衡控制等关键领域均取得了显著成果;大模型技术的国产化程度正处于快速发展阶段,国内大模型(如华为盘古、阿里云通义)在机器人视觉、语言和动作协作领域展现出强大潜力,并与国际知名大模型(如 ChatGPT、PaLM-E)同台竞技;仿真软件的国产化程度正在逐步提高,国外软件如 Gazebo 和 MATLAB 等在仿真领域被广泛应用,而国内则正在加大力度发展自研仿真工具,并推动其标准化与推广。通过建立统一的建模规范、仿真精度和接口标准,国内仿真软件逐渐具备更高的适配性,推动数字孪生系统的发展。

未来,应加快基础软件的标准化进程,通过制定接口标准、算法评估标准、数据集标准、仿真性能标准及开发工具和协议标准等,为不同厂商和研发团队提供统一的规范和框架,提升基础软件的互操作性、可扩展性和效率,降低研发成本,推动技术创新,并促进产业链协同发展,加速技术自主可控,提升国际接受度与竞争力。

2.1.3.3 中游

人形机器人整机系统是人形机器人产业链的核心环节,也是实现人形机器人功能集成和商业化应用的关键。近几年,国内外涌现了一批优秀的整机系统企业和极具代表性的人形机器人整机产品。

当前,我国人形机器人产业在国际上处于领先并跑阶段。未来,可通过制定人形机器人本体整机系统相关标准,涵盖模块化设计、接口兼容性、整机性能评价和安全规范等核心要素,进一步提升我国产品在性能、可靠性、互操作性等方面的竞争力,加速产业链协同,推动产业升级,同时助力国内企业在全球市场中打造技术优势和品牌效应,实现从并跑到领跑的跨越。

2.1.3.4 下游:应用场景

人形机器人下游产业链是推动商业化应用的关键环节。随着技术进步和市场需求的不断增长,下游产业链正迅速扩展,成为人形机器人普及的重要驱动力。未来可通过制定不同应用下的评价标准、场景互联互通标准、应用安全标准、交互标准等,形成人形机器人标准化应用,推动产业链各环节高效协同与资源共享,为商业化普及和产业规模化发展提供坚实的基础。

1)工业制造场景

人形机器人有望成为工业制造的核心技术,特别是在汽车制造等标准化场景中已开始推广应用,如底盘装配、外观检测、物料搬运等。此外,3C 制造和安防巡检领域也在逐步实现“机器替人”的应用。

2)家庭服务场景

家庭场景是人形机器人最具应用潜力的市场应用。从功能看,人形机器人走入家庭可分为陪伴和服务两个路线, 陪伴是针对老幼的情感陪护、安全看护、教育/娱乐等,服务是整理家务、家居管理等活动。已有部分厂商尝试将人形机器人应用于家庭场景,完成简单家务、互动交流等。

3)医疗康养场景

在人形机器人医疗康养领域,人形机器人正成为应对老龄化和提供高质量医疗服务的重要工具。它们可替代危险、高强度、精准操作的工作场景,并在看护和服务方面提供支持。例如,Paro 治疗机器人为老年人和儿童提供情感支持,缓解焦虑和孤独。

4)商业服务场景

商业服务人形机器人主要应用在封闭环境下的室内场景中,迎宾接待、导览讲解等场景对机器人的运动性能要求不高,且部署周期短,将成为商业服务领域最先落地的场景。当前,商业服务人形机器人产品应用在展览展厅、商超酒店、网点大厅等场合,主要用于迎宾接待、导览讲解、需求解答、舞蹈表演等。

5)高危作业场景

人形机器人在核、危、化、害等高危环境下的应用实现对人力替代、能力互补,降低作业人员危险性,在应急救援场景的应用是与人协作共融,提高救援效率,两类场景下的地形复杂、环境极端,人形机器人在高危/救援下的应用成为最有价值的场景,也对机器人的性能和形态提出了更高的要求。

6)教育培训

在教育培训领域,人形机器人可以作为教育助手或辅助教师使用,他们可以与学生进行互动,解答问题,提供个性化教学。此外,人形机器人还可以用于模拟实验、演示科学原理、编程教育等教学场景,丰富教学内容,为教育注入更多创新元素,激发学生的创造力和想象力。

7)物流运输场景

人形机器人可以在仓储、装卸、分拣、包装、配送等环节提升工作效率和管理水平。亚马逊正在测试 Agility Robotics 开发的双足机器人 Digit,提升仓库作业效率,包括卸货、搬运和管理货架等任务。人形机器人在物流运输行业的运用将助力物流产线的智能化升级,实现低成本、高效且智能化的物流运输体系。

8)其他场景

人形机器人还能在其他更多场景开展应用。例如在极端环境下开展科学探测和研究、在特殊场景下进行搬运物资、执行特定任务等。未来,随着人形机器人运动性能和智能化水平的不断提升,以及生产成本的降低,人形机器人在上述应用领域的集群化和规模化的应用将成为可能。

2.1.4 产业发展趋势

目前人形机器人尚未在下游终端应用领域实现规模化商业落地,且部分核心零部件的应用仍未得到充分验证,全球人形机器人供应链仍处于持续构建阶段。然而,随着创新体系的逐步建立以及关键技术如“大脑、小脑、肢体”的持续突破,未来有望形成高效可靠的人形机器人产业链和供应链。人形机器人不仅能够将人类从繁重和危险的劳动中解放出来,提升企业经济价值,还能满足人类情感沟通需求。随着技术进步和应用领域拓展,预计未来几年人形机器人市场将迎来显著扩张和商业化突破,并被广泛应用于个人、家庭、企业、工厂等各类场景,推动人类社会往更高智、更协同、更高效的方向发展。

2.1.5 产业对标准化的需求

随着人形机器人产业的快速发展,其在社会各领域的广泛应用凸显了产业标准化的迫切需求。从产业技术发展与创新推动出发,需要通过标准化推动基础共性技术通用化、零部件模块化、接口统一化,助力产业降本提质;从产业生态构建和持续优化出发,需要通过标准化降低生产和维护成本、建立全产业链协助网络、激发市场活力;从提升用户体验和社会接受度出发,需要通过标准化规范集成与应用要求、规范伦理和隐私保护,进而提高用户信任度;从监管角度,需要通过标准化,促进产业合法合规,提升市场信心。未来,人形机器人产业将在技术创新、标准引领和市场需求的三重驱动下迅速发展,实现商业化和全球化的突破,推动社会向更加智能化、协同化和高效化的未来迈进。

2.2 技术发展现状与趋势

人形机器人由大脑、小脑、机械臂、灵巧手、腿足、一体化关节等关键部分组成,集成实现对环境的感知交互、运动控制、任务执行等功能,涉及整机、传感器、执行器、控制器和动力能源等关键部组件,本白皮书将从机械本体与核心部件、动力系统、多模态感知与场景理解、自主任务规划与决策、运动规划与控制、移动操作与人机交互、大模型训练系统、仿真训练系统、操作系统等维度分析人形机器人的关键技术研究现状和发展趋势,并从中识别标准化需求。人形机器人核心技术架构见图 9。

2.2.1 机械本体与核心部件

人形机器人机械本体的技术特点在于其高度模拟人类形态,具备灵活的“肢体”,包括一体化关节、灵巧手、仿人机械臂、仿人腿、骨架躯干、柔性电子皮肤,需要高强度紧凑的机械结构,也需要实现灵活性和轻量化。

人形机器人一体化关节是一种高度集成化的机器人关节组件,它将伺服驱动器、无框力矩电机、减速器(谐波、行星、滚柱丝杠)、编码器等关键部件集成在一个模块中,可以提高人形机器人的运动精度、灵活性和负载能力,是实现高效、稳定操作的核心部件。通过采用精密传动系统、高速通信接口、优化热设计以及标准线束装配等方式实现精准力控、高扭矩密度、降低功耗和控制发热、提升一体化关节的可装配性和可维护性。实现一体化关节的集成需要克服一系列技术难点,如驱动器等组件的精密度和可靠性保证、控制算法的开发和优化、接口的标准化等。此外,如何在保证性能的同时实现关节的小型化和轻量化,也是当前面临的重要技术问题,需要在整体设计、材料应用、制造工艺等方面进一步提升。

未来,人形机器人一体化关节模组将不断向轻量化、紧凑化、高性能化、高可靠性、标准化、模块化以及智能化方向发展,包括建立标准接口实现模块化设计,降低生产成本和维修成本,提高可扩展性和可升级性。

灵巧手是一种高度模仿人手功能的机器人末端执行机构,它融合了深度仿生、柔性感知、微机电系统以及高性能材料等前沿技术,是实现智能机器人技术变革的关键组件,是人形机器人实现灵巧操作、人机交互的关键部件,决定了人形机器人的操作能力和工作性能。灵巧手的分类按驱动方式分为电机驱动式、气压/液压驱动式(Festo)以及形状记忆合金驱动式(Hitachi),当前全球范围内,电机驱动已成为商业化灵巧手主流驱动方式,具有高效能、低噪音、易控制等特点。按照手指数量分为 2 指、3 指、多指(3/4 指)和 5 指,按照主动自由度分为小于 6 自由度、6-12 自由度以及 12 自由度以上。

灵巧手能够执行精细的操作任务,如抓取、搬运、操作工具等,通过集成各种传感器,具备触觉、视觉等多模态感知能力,能够实时感知环境变化和操作对象的状态。当前灵巧手的技术方案尚未完全收敛,在传动方式和传感器方案上尚未有统一意见,连杆具有大负载、高精度和低成本的优势,但在灵活性上不及腱绳,齿轮方式受限于加工精度和空间尺寸也一直未能推广。如何收敛灵巧手技术路线,在保证灵巧手可靠性、负载能力、精度和成本的条件下,进一步提升灵巧手的自由度和灵活性,提高灵巧手的操作精细度,使其在更多领域得到广泛应用,是未来技术发展和突破的关键。

仿人机械臂的设计灵感来源于人类的手臂,这使得它能够模仿人类手臂的各种动作,如抓取、搬运、操作等。在人形机器人中,仿人机械臂的存在大大增强了机器人的功能性和实用性,使其能够胜任更多复杂、精细的任务。仿人机械臂的构型与传统机械臂不同,通常包括模拟肩关节、肘关节与腕关节的多个自由度。肩关节通常配置三个自由度,使机械臂具备较强的旋转能力和较大的运动范围,肘关节则通常设计为一个自由度,以确保机械臂能够进行精确的弯曲与伸展,腕关节通常设计为二自由度或三自由度的球铰,用于末端姿态调节。这些自由度配置赋予机械臂与人类手臂类似的运动特性,能够完成复杂的操作任务。

通过对人类手臂的构型研究与运动学仿真优化,进一步提高仿人机械臂的工作空间与灵活度。其中腕关节的球铰设计要求末端同时具备俯仰和侧摆能力,传统串联关节难以实现。通过新型的线性执行器与并联机构的组合,能够更好地分配负载,降低惯性和反冲效应,提高机械臂的响应速度与操作精度。通过拓扑优化与增材制造技术,机械臂的每一部分都能够根据实际工作需求进行精确设计,既保证了结构的强度,又降低了整体的重量。利用新型复合材料与多材料加工技术,能够提高机械臂在高强度、高频率操作下的耐用性与稳定性,确保其在各种复杂环境下的长期可靠性。仿人机械臂将朝着多功能化、模块化和标准化方向发展,通过模块化设计,不同的功能模块可以根据具体需求进行组合和配置,从而实现多种应用场景下的灵活应用,如何在保证高承载能力和精确控制的同时提升机械臂的适应性与智能性是未来研究的重点。

人形机器人具有类人腿部结构,可以实现奔跑跳跃等高动态运动,也具备上台阶过沟壑等复杂环境适应能力,其设计和创新直接影响到机器人的行走稳定性、运动效率以及与环境的交互能力。人形机器人腿足自由度配置普遍包括模拟人体髋关节的三个自由度、模拟膝关节屈伸的一个自由度以及模拟踝关节两个球形关节的自由度,这六个自由度的活动关节赋予机器人与人腿相似的形态与功能特性。柔性构件与肌腱材料的运用提升了人形机器人四肢的柔韧适应性和抵抗冲击负荷的能力。足部作为机器人与环境交互的主要部位,其对非结构地形的匹配适应程度直接影响人形机器人与环境的交互效果,从仿生学的角度出发,参考人足的结构和功能设计人形机器人的仿生足部结构,提高人形机器人足部的缓冲能力,能够为降低人形机器人高动态运动中的地面冲击力提供一个有效的解决方案。

参考生物足功能开发仿生足也是提高机器人运动能力常见的解决方法。基于执行器的选择与布置,腿足结构设计与加工技术对人形机器人的运动能力、稳定性和效率起着关键作用。早期的大框架、大重量设计经过运动学、动力学分析和拓扑优化等技术的改进,现已成为可在保证腿足强度的同时达到轻量化与可靠性的平衡设计。同时,利用增材制造技术融合多材料多工艺方法构建复杂的机械框架也提高了腿足的灵活性,兼顾强度、惯量、运动范围、外观等多种需求。随着各个领域技术的发展,未来以通过新结构与新传动方式的突破提高人形机器人的能效和稳定性,通过引入柔性材料等新材料结合仿生设计实现更灵活、高效的运动和适应性,从而更好地应对各种复杂环境和任务要求。

人形机器人的骨架躯干部分是人形机器人的“支撑系统”,类似于人类的骨骼结构,为机器人提供整体的支撑、运动能力和稳定性。骨骼结构设计涉及仿生学、动力学、机械工程、材料科学等多个领域,其设计要求具备高强度、轻质和高韧性,目的在于模仿人类骨骼的结构,实现灵活自然的运动,同时确保在执行运动时的稳定性与机动性。为实现这些要求,人形机器人骨架常使用高强度且轻质的材料,其中金属材料如铝合金、钛合金,碳纤维复合材料(CFRP)、PEEK(聚醚醚酮)等具有较高的强度和刚性,适用于需要承受较大负载的部位;碳纤维和复合材料则具有较低的重量和良好的耐腐蚀性,适用于需要轻量化的部位。

高强度轻量化新材料不仅轻巧耐用,而且具有高强度和抗疲劳性能。这些材料的应用可以提高人形机器人的强度和刚度,同时减轻其重量,从而提高人形机器人的机动性和能效。这对于人形机器人的运动性能和动态特性有着至关重要的影响。近年来,国内人形机器人骨架躯干的技术研究中取得了显著进展,尤其是在材料选择、框架结构设计、驱动与控制系统方面。国内研究者在使用碳纤维复合材料(CFRP)、PEEK 材料等轻量化高强度材料方面有所突破,尤其是在优化人形机器人骨架结构和提升运动精度方面取得了初步成果。

柔性电子皮肤能够赋予人形机器人类似人类皮肤的敏感性,以及触觉、视觉、听觉、味觉和嗅觉等感知能力。这使得机器人能够更准确地感知外界环境,如压力、温度、湿度等物理量,从而做出更加智能的反应。柔性触觉传感器的核心材料和制造工艺是当前的“技术瓶颈”。国外在柔性基底材料(如聚二甲基硅氧烷、聚对苯二甲酸乙二醇酯)以及导电填料(如石墨烯、碳纳米管等)的选择和优化上已取得较大突破,这些材料不仅具备良好的柔性,还能保证高分辨率和高耐用性。国内在这些高性能材料的研究和应用上尚处于追赶阶段,材料的耐用性和传感器的分辨率仍存在不小的差距。触觉传感器阵列的布局和集成是电子皮肤技术中的关键挑战。虽然单个传感元件的灵敏度、分辨率等性能已有较大提升,但在大面积阵列化部署时,面临着高成本、拼接问题、电路连通性差等难题,这在国内外都存在较大的技术挑战。

国内在阵列式触觉传感器的生产成本和大规模部署方面面临较大困难。国内在信号传输和标定机制上相对滞后,尤其是在多物理量传感、信号干扰和一致性优化方面,仍依赖于国外技术的支持。相比之下,国际上尤其是欧美在算法优化和传感器标定的精度和稳定性上已经取得了显著进展。未来,柔性触觉传感器将朝着更高精度、更灵敏和更大面积的方向发展,阵列化、柔性化将成为主流趋势。智能化的传感技术将在触觉感知中发挥更大的作用,配合人工智能算法优化,电子皮肤的功能将得到显著提升,将推动人形机器人向更高智能化、柔性化的方向发展。

2.2.2 动力系统

目前人形机器人的动力能源设计包括电驱动、液压和气动等多种方式。

人形机器人电驱动技术是指利用电机作为动力源,通过电能转化为机械能,驱动人形机器人的关节、肢体等部件进行运动的一种技术。电驱动技术也开始向多样化方向发展,包括不同类型的电机(如直流电机、交流电机、伺服电机等)和传动装置(如减速器、齿轮箱等)的选择和应用。当前,人形机器人电驱动技术已经高度集成化,电机、传动装置和控制器等关键部件被高度集成在一起,形成了一个紧凑、高效的动力系统。同时,电驱动技术也开始与智能化技术相融合,通过智能算法和传感器数据来实现对电机的精准控制和优化调节,从而提高了机器人的运动性能和智能化水平。在未来的人形机器人电驱动技术研发中,轻量化与高效化设计将成为重要的趋势。通过优化电机结构、材料和制造工艺等方面的设计,可以降低机器人的重量和能耗。液压传动从早期开关控制、比例控制,逐步发展到可精确控制位置、速度和加速度的伺服控制,目前已发展为最新的数字液压。液压相比于电机驱动,功率重量比有 5 倍以上明显优势,可为机器人提供更大负载能力和更好的运动敏捷性。

同时,液压的功率可复用及动态分配,即:全部功率可集中于某一个液压作动器持续稳定输出,也可以按需分配给各个液压作动器,进一步减小了功率单元的体积重量。液压还具有更好的冲击耐受能力和集中散热的优势,因而在机器人这类移动装备中成为不可或缺的优势技术。人形机器人需要多关节协同运动,对协同精度有极高的需求,因而通常采用伺服阀控制液压缸直线往复运动或液压马达旋转运动,通过位移和压力传感器与微处理器构成闭环反馈控制系统。近些年,集成了伺服阀、传感器、管路等一体化的液压作动器利用增材制造技术,进一步压缩和减小了液压作动器的体积和重量,也简化了液压传动系统的设计、制造、调试和维护等工作。液压驱动虽然有明显的技术优势,但伺服阀控制的液压系统受外在诸如负载、压力、温度、干扰等因素影响,可靠性与稳定性存在不足,也阻碍了人形机器人应用的进步与发展。

人工肌肉是指能够在外界物理或化学刺激下(机械应力、电、磁、热、光、生物电、分解反应等)发生伸缩、膨胀、弯曲、扭转等运动并对外做功的柔性材料或器件。近年来,人工肌肉是仿生机器人驱动研究的前沿热点之一,其核心目标是模拟生物肌肉的驱动功能。现阶段,在各种类型的人工肌肉中,气动人工肌肉研发成本低,仿生性突出,使用最为广泛。气动肌肉的工作原理是通过外部压缩空气驱动,实现推拉动作,从而模拟人类肌肉的运动,其具有高功率密度以及大比例变形的能力,为机器人关节提供较大力量的同时,能够保持轻巧的重量。随着轻质高强纤维、纳米复合材料及智能液晶高分子等新型材料的加入,气动肌肉的功率密度、疲劳寿命和可控性将进一步提高,从而在软体机器人、外骨骼、康复医疗及仿生机械臂等领域得到广泛应用。与此同时,嵌入式传感器与自适应控制算法的结合使气动肌肉能精准应对复杂环境和精细操作;微型压缩机、可变刚度元件与模块化气动控制单元的集成则促进了气动肌肉控制系统的紧凑与高效化。

然而,在实际应用过程中,气动肌肉的性能并非完美无缺,气动肌肉的使用需要配备外置气源,带来系统空间的占用。其次,气体的可压缩性也会导致控制精度的局限。未来,气动肌肉将通过材料性能突破与结构优化,实现更加柔性化、智能化和高效化的驱动,并在软体人形机器人仿生控制等领域展现出广阔前景。

综合以上分析,国内在人形机器人整机设计和电驱动关节这个核心零部件上,处于国际先进水平。但是,其他核心零部件与国外厂商存在一定差距,比如灵巧手在系统集成度、感知丰富度、灵巧自由度方面与国外存在差距;驱动器和 AI 芯片目前被 DSP、TI、英伟达、intel等国外厂商垄断,国产厂商在生态满足度、算力上与国外厂商差距明显;dTOF 相机主要采用 intel realsense,国内厂商在深度感知与图像处理算法、高性能的图像传感器定制芯片、探测距离与视场角等关键技术上与 intel 存在较大差距。机器人相关算法和软件领域,国内在强化学习运动控制算法、智能移动与操作算法与国际持平,但这些算法需要建立在英伟达 ISAAC Sim 等国外仿真软件生态之上。所以,机器人芯片和机器人仿真软件存在卡脖子风险。

2.2.3 多模态感知与场景理解

人形机器人高精度环境感知与场景理解的技术是其实现自身状态感知、自主任务规划、任务执行和人机交互等功能的核心基础,是实现智能化和自主化的关键,这一技术涵盖了多个关键领域,包括传感器技术、算法处理、硬件支持等。

在环境感知方面,人形机器人通过集成多种传感器,如视觉、听觉、触觉、嗅觉等,实现对环境的全面感知,正逐步实现高精度、全方位的感知能力。这得益于传感器技术的飞速发展,如高精度视觉传感器、激光雷达、惯性测量单元等,它们能够实时获取并分析周围环境的数据。特别是双目三维环境感知技术,通过模拟人类双眼视觉系统的观测原理,利用双目相机对获取图像进行立体匹配,得到图像中像素点的准确视差,从而获取周围环境的准确深度信息。这一技术的运用,使得人形机器人能够在复杂的三维工业场景中,对外界环境进行真实的刻画及数字模型的重建,为后续的决策规划提供了丰富的信息支持。

人形机器人通过对环境信息的分析和处理,理解并识别出环境中的物体、场景及它们之间的关系,从而做出合理的决策和行动。随着深度学习等人工智能技术的不断发展,人形机器人在场景理解方面也取得了显著进步,能够更准确地理解复杂的场景信息。多模态数据融合技术也提高了人形机器人对环境信息的感知和处理能力,使其能够更准确地判断环境中的情况。但目前的融合以图像、文本和语音为主,对于感知信息的运用却局限于一类信息解决一类问题,缺乏对多模态信息的有效融合与综合运用,这限制了人形机器人在人类生活环境中灵活处理各类复杂问题的能力。

2.2.4 自主任务规划与决策

人形机器人自主任务规划与决策技术是指人形机器人能够在没有人类直接干预的情况下,根据预设的目标和任务,自主进行任务规划、路径选择、决策制定以及执行的能力。这一技术是人形机器人智能化的重要体现,也是其能够高效、自主地完成各种复杂任务的关键。目前,人形机器人正逐步展现出强大的自主决策和智能规划能力。这得益于人工智能技术的不断突破,特别是机器学习、深度学习以及大模型等智能算法的运用。这些算法能够让人形机器人从大量数据中学习并提升其感知和决策能力,从而实现对环境的快速适应和自主决策。例如,人形机器人可以通过智能算法识别图像、理解语言、预测环境变化,并在复杂情境中做出自主决策。这种自主决策能力,让人形机器人在面对未知环境或任务时,能够迅速调整策略,确保任务的顺利完成。

目前在人形机器人领域运用较多的是决策论方法,主要基于多模态数据在决策级的融合;此外应用较多的还有人工智能方法如模糊逻辑、神经网络、遗传算法、专家系统等。决策大模型在人形器人的决策过程中扮演着核心角色。以 ChatGPT for Robotics、谷歌PaLM-E 为代表,这些模型能够从大量数据中学习并提取出有用的信息,用于指导机器人的决策过程,技术方向从 LLM 向强化学习(RL)演进。基于 RL 的范式可以使模型能够在不同环境和任务中学习和适应,实更高级的决策能力。

未来,建立准确的环境模型、对场景进行分析和理解、让人形机器人能够根据历史数据和先验知识对当前的环境状态和可能的动态变化进行预测和推测从而做出智能决策将是研究的重点。

2.2.5 运动规划与控制

运动规划是人形机器人技术中的关键环节,是在给定的起始状态和目标状态之间,为人形机器人找到一条符合约束条件的路径或轨迹。这些约束条件可能包括无碰撞、路径最短、机械功最小等。人形机器人的运动规划通常需要考虑机器人的动力学特性、环境障碍物以及任务需求等多个因素,通常需要利用传感器获取周围环境的信息,如障碍物位置、地形特征等。然后,基于这些信息,机器人会运用各种算法和策略来规划出一条最优或可行的运动路径。这些算法可能包括 A*搜索算法、Dijkstra 算法、人工势场法等。通过运动规划,人形机器人能够在复杂环境中自主导航,避免碰撞,并高效地完成任务。在人形机器人中,运动控制涉及到对机器人各个关节和肌肉的精确控制,以实现复杂的动作和姿态。为了实现高精度的运动控制,人形机器人需要采用先进的控制算法和传感器技术。控制算法可能包括PID 控制算法、基于模型的预测控制算法等。基于深度学习和强化学习的运动规划算法使得机器人能够从大量数据中提取出有效的运动式,并在面对未知环境时做出最优决策。这种自适应能力让人形机器人在执行任务时更加灵活和高效,无论是室内导航、室外巡逻还是复杂作业场景,都能展现出出色的表现,这也是人形机器人智能化的重要体现。

控制包括了底层控制、全身控制和模型控制,底层控制主要是对人形机器人各个关节电机的直接控制,依据从上层传递下来的控制指令(比如期望的关节角度、角速度、扭矩等参数),通过电机驱动器等硬件设备精确调节电机的运转,实现关节的精准动作,主要采用运动学分析与建模、动力学分析与建模和控制算法。全身控制是协调多个关节之间的运动关系,进行运动规划和轨迹生成。比如在人形机器人行走时,全身控制要规划好腿部各关节以及胯部、腰部等相关关节的配合,生成从起始姿态到目标姿态的连续运动轨迹,使得行走动作自然流畅且符合运动学和动力学规律。模型控制更多地从机器人整体行为和任务角度出发,基于感知到的环境信息以及预设的任务需求做出宏观的运动决策。

目前,人形机器人在运动控制方面也取得了显著进展。通过先进的步态生成算法和平衡控制技术,人形机器人能够在不同地形上稳定行走、跑步和跳跃。同时,动态避障技术的运用让人形机器人在行进过程中能够自主检测并绕过障碍物,大大提高了其安全性和可靠性。

2.2.6 移动操作执行与人机交互

平稳准确的步态移动、灵巧操作和人机交互是人形机器人的主要功能,这些功能共同构成了人形机器人在各种应用场景中高效、智能执行任务的基础。

平稳步态移动是人形机器人实现自主导航和移动的基础,依赖于高精度传感器、地图构建算法、路径规划算法以及导航与控制算法等多种技术的综合应用,可以实现机器人在多样化环境中的自主导航与控制。这项技术主要涵盖四个方面:一是环境感知和空间定位,通过激光雷达、摄像头、超声波传感器等多种传感器,实时采集周围环境的信息,包括障碍物的位置、形状、距离等,为后续的定位与导航提供数据支持;二是地图构建,基于采集到的环境信息,结合机器人自身的运动状态,构建出环境的二维或三维地图,为机器人的路径规划提供依据;三是路径规划,在已构建的地图基础上,根据机器人的任务目标和当前位置,运用算法计算出一条最优或次优的行动路径;四是导航与控制,将规划好的路径转化为机器人的实际运动指令,通过控制算法实现机器人的精确导航。在导航过程中,机器人需不断根据环境变化和自身状态调整运动策略,以确保安全、高效地到达目的地。

未来,人形机器人定位导航技术的发展趋势是基于多传感器融合的全方位环境协同感知与机器学习和人工智能相关技术的再融合,借此实现更高精度的定位与导航能力,以适应更复杂多变的环境。同时,应强化自主性与智能性,使机器人能够更灵活地应对各种突发情况。对于实际中复杂的使用场景,基于情景认知的动态物体预测及自主避障也将成为重要的研究方向。

灵巧操作是人形机器人实现复杂任务的关键。通过高度集成的传感器、执行器和先进的控制算法,人形机器人能够模拟人类的手部动作,进行精确的抓取、旋转和操作。传统的技术路线是人工解析建模物体感知与机械臂决策、规划、控制多个环节并优化求解,其可解释性强,在定义范围内有较好的通用性,但对复杂场景难以准确建模,且对场景物体变化泛化性不足,难以适应开放场景。随着物体感知技术适应性的增强,抓取规划成为了重要研究问题和研究热点。传统方法基于力闭合等抓取质量指标进行解析计算,存在依赖于已知物体模型、无法应用于物体模型未知的开放场景的问题。为解决该问题,现有的主流方案是基于数据驱动的抓取规划算法,可用于未知物体抓取姿态预测。

人机交互是一门研究机器人与人之间交互关系的科学。在传统的工业机器人领域,机器人在无人环境下工作,按照人类预设定的程序工作,不会根据环境变化进行自我调整。进入智能化时代后,机器人可以自我调整,对不确定的操作对象、操作环境和操作任务都能够实现自适应,人与机器人之间的交互也从单向指令变成双向甚至多向。交互技术包括遥操作、多模态交互、脑机交互等。遥操作是指通过远程控制系统,使操作者能够在一定距离外对人形机器人进行操控的技术,主要由感知系统、控制系统和通信链路三部分组成,依托于高速通信网络,通过各种传感设备,测量人肢体的运动信息,并作为控制指令去控制机器人的运动与操作,同时再将机器人的视觉、力觉、触觉等各种感觉反馈给人,实现人与机器人的深度耦合。

多模态人机交互将听觉、视觉、力觉、嗅觉,以及红外、激光、温度等多种模态的感知信息进行融合,更加准确地理解人、物体和场景,进而能更加自然地交互。在多模态交互中,自然语言处理技术起到了至关重要的作用。通过自然语言处理技术,机器人可以理解人类的自然语言指令,并进行相应的回应和操作。除了基本的语言交互外,业界正在研究情感识别与交互,通过面部表情识别、语调分析等技术,人形机器人可以感知人类的情感状态,并根据情感状态进行相应的回应和互动。脑机交互是利用人的大脑信号来控制人形机器人或其他设备,实现人与机器人交互之间的一种新型交互方式,该概念最早在神经科学和人工智能领域被提出,旨在探索如何通过大脑信号与计算机进行交互,初步的研究主要集中在大脑信号的采集、预处理和简单识别上,为人形机器人脑机交互的发展奠定了基础,目前也有研究利用脑电波探测提高目标探测的准确性,完成机器人的操作,实现军事应用。

2.2.7 大模型训练系统

大模型在人形机器人的应用可分为两个层次,一是结合任务理解与环境数据完成最优路径规划,二是自主生成运动指令以实现运动控制,最终完成机器人的人机交互、环境感知和上层规划。在完成任务路径规划方面,通常是大语言模型(LLM)、 视觉-语言多模态大模型(VLM)、视觉导航模型( VNM)三个大模型相结合,人形机器人在用视觉导航模型(VNM)采集环境数据后,利用大语言模型(LLM)解析为地标文本序列,然后基于视觉-语言多模态大模型(VLM)比对到对应目标,最后用视觉导航模型(VNM)完成规划。

基于任务理解,大模型能自主生成执行任务的运动控制代码,为运控模块提供运行的指令,以驱动机器人运动。大模型和 AI Agent 技术带来了相比传统基于规则和强化学习算法更强大的意图理解能力和高级任务规划能力,相应地也带来了更高的计算复杂度与能耗开销,需要更强大的硬件算力和电池技术支撑。复杂的任务决策往往需要依托网络边缘和云端部署更大规模的模型和算力支持,同时结合云端信息输入、网络通信质量、终端能耗限制等多方面因素进行综合推理计算和任务分配,因此需要通过端-网-云充分协同和通算融合,实现按需动态的算力迁移与卸载,以及系统性的算力资源调配与综合能耗优化。

近年来,人形机器人模型训练系统取得了显著进展,深度学习算法能够处理大量的数据和信息并自动提取出有用的特征,从而实现对机器人行为的精确控制。这使得人形机器人在复杂环境中能够更加准确地识别物体、理解指令,并做出合理的决策。此外,随着传感器技术的不断进步,人形机器人模型训练系统也获得了更多的数据来源。传感器能够实时感知环境信息,并将这些信息反馈给模型训练系统。

这使得系统能够根据实时数据进行调整和优化,进一步提升机器人的性能和智能化水平。数据是机器学习算法和模型的基础,算法的产生、模型的优化、能力的泛化和场景的应用都需要大量的数据作为支撑,而数据采集、分析、处理面临诸多难题。为了建设自主可控的高质量数据集,国内一些机构也开始开展数据集建设,涵盖了数据采集、数据上传、自动标注、数据增强、大规模回归测试、应用验证等环节,建设数据生产、采集、标注和存储一体化的综合数据平台。数据采集规范统一是未来行业发展面临的问题也是趋势,将数据采集内容、采集方式、采集安全标准化对于从源头规范人形机器人数据生态具有重要意义。

2.2.8 仿真训练系统

仿真测试技术能够有效地解决人形机器人收集真实世界中动作轨迹数据成本高昂的问题,提升其在不同硬件平台上的泛化能力。目前的研究已证明,通过在仿真测试环境中简单地模拟人类部分形态能够测试人形机器人的能力。然而,现有平台在场景和任务的多样性和复杂性方面仍存在局限,难以满足策略泛化的需求。为了克服这些问题,构建一个专门针对人形机器人交互式3D场景的仿真平台是目前国内外的研究重点,主要针对场景数据集、NPC 系统和基准测试三个方面进行规划。能够构建城市规模的景观场景数据集,从而大幅扩展机器人可操作的环境范围,利用大型语言模型(LLMs)生成具有不同社交角色的 NPC(非玩家角色)系统,用于交互、任务创建和分配,为人机交互在仿真中增加了新的维度。

仿真平台一般包含三个维度的基准测试,包括对象定位导航、社交定位导航和定位操作。在大规模场景中,现有的算法很难同时执行高层感知、规划和底层控制并取得满意结果,基准测试提供了更多的物理真实设置,有助于缩小模拟和现实世界之间的差距,优化控制策略。构建的基准测试和评估指标具有明确的难度分级,能够满足不同领域和层次的研究需求。基于人形机器人的研究进展,仿真测试在国内外都还处于起步阶段,整体上对仿真测试在平台、建模、数据集和场景等方面缺乏规范化的评测体系。

2.2.9 操作系统

传统机器人的操作系统侧重于控制机械或自动化设备,仅关注运动控制和任务执行。然而面向人形机器人的操作系统需处理十分复杂的运动协调、人机交互、环境感知等任务。因此,为了使人形机器人更智能、更高效、更稳定地执行相关动作,以满足不同行业应用的需求。

单机操作系统方面,在20世纪中后期,人形机器人的研究还处于起步阶段,那时的机器人操作系统尚未形成,主要依赖于工程师的手动编程和调试。随着计算机技术的快速发展,特别是嵌入式系统的广泛应用,人形机器人开始配备单机操作系统。这些操作系统主要负责管理机器人的硬件资源,如CPU、内存、传感器等,并提供基本的任务调度、中断处理等功能。进入21世纪,随着人工智能技术的兴起,人形机器人单机操作系统开始融入更多的智能化元素。例如,通过引入机器学习算法,机器人能够更好地适应环境变化,实现更加灵活和智能的行为控制。

多机操作系统方面,与单机操作系统相比,人形机器人多机操作系统的研究起步较晚。多机操作系统的初步探索阶段主要关注如何实现多个机器人之间的通信和协同。这包括设计高效的通信协议、开发可靠的同步机制以及构建有效的协同策略等。随着研究的深入,多机操作系统开始支持更加复杂的协同任务,如分布式感知、协同决策和协同执行等。近年来,随着云计算和大数据技术的快速发展,人形机器人多机操作系统开始融入更多的云端智能。例如,通过云计算平台,多个机器人可以共享计算资源和数据资源,实现更加高效的任务分配和协同工作。同时,大数据技术的应用也使得机器人能够更好地学习和适应环境变化,进一步提升协同工作的效率和智能化水平。

2.2.10 关键技术标准化需求分析

标准化在人形机器人的研发和应用中至关重要。如,机械本体的标准化能确保各部件的互换性和兼容性,降低生产和维修成本,提高生产效率;环境感知模块的标准化则能统一数据格式和接口,提高数据处理效率,加速技术迭代;决策规划模块的标准化有助于提升算法的可比性和可靠性,确保机器人在不同场景下的决策规划具有一致性和稳定性;运动控制模块的标准化能提升控制精度和响应速度,降低控制系统的复杂性和维护成本;作业操作模块的标准化能够规范人形机器人灵巧操作等功能,提升机器人的易用性;人机交互模块的标准化能优化人机交互界面的设计规范和操作流程,提升用户体验和满意度;定位导航模块的标准化则能确保机器人在各种环境中准确定位和导航,提高机器人的实用性和应用范围;检验检测模块的标准化则能统一评价标准和方法,提高人形机器人的评价准确性和可信度等。

来源:机智的扑克

相关推荐