摘要:具身智能是指能够通过交互感知习得技能并生成知识的一类人工智能,已成为发展通用人工智能最具前景的技术路线。具身智能产业本身及产生辐射效应将重塑制造业企业工作流,引起制造业生产函数、人机关系、制造范式深度变革,并变革产业发展格局。
导语
具身智能是指能够通过交互感知习得技能并生成知识的一类人工智能,已成为发展通用人工智能最具前景的技术路线。具身智能产业本身及产生辐射效应将重塑制造业企业工作流,引起制造业生产函数、人机关系、制造范式深度变革,并变革产业发展格局。文 / 曾昭睿、周康林、柯罗马
制造业作为经济发展的核心驱动力,在美国、德国和欧盟等国家和地区受到高度重视。2019年德国公布《国家工业战略2030》,2020年欧盟将“工业4.0”战略升级为“工业5.0”,2020年的新冠疫情冲击造成全球供应链出现严重中断,全球产业链分工逻辑从效率优先向效率与安全并重转变,进一步推动制造业本土化。
制造业在中国经济崛起中也发挥了重要作用。为发挥产业链供应链安全问题和制造业在保障国家安全等方面的关键作用,国家 “十四五”规划就提出了“保持制造业比重基本稳定”的重要目标,二十大报告进一步指出“坚持把发展经济的着力点放在实体经济上,推进新型工业化,加快建设制造强国”。
传统自动化技术赋能制造业。回顾近代人类文明迅速发展的历程,就是科学技术不断为制造业赋能、提高制造业自动化程度的历史,新兴的科学技术不断应用于制造业中,以促进制造业的发展,进而推动经济的快速增长。最重要的通用目的技术有四种,分别驱动了四次工业革命,它们是蒸汽机、电力、内燃机和数字技术。这些传统自动化技术显著提高了制造业生产效率,但面对高度复杂和动态变化的生产要求和生产环境仍然存在诸多局限。
具身智能(Embodied AI)为制造业企业工作流与产业格局带来全新的发展契机。具身智能与基于传统规则的人工智能不同,其通过与人类及物理环境的交互,实现感知与认知,从而在面对复杂环境和动态变化时,能及时自主决策并执行任务。具体而言,在生产线各环节中,“具身智能工人”与“具身智能设备” 不仅能进行高度复杂的生产作业,还能处理任务执行中各类信息进行迭代学习,优化自身行为。这使得具身智能具有高度生产灵活性,随时响应,优化流程,实现增效降本,提高产品质量及市场匹配度。
具身智能将引起制造业生产函数、人机关系、制造范式、产业间关系的深度变革。具身智能制造本身与具身智能应用于传统制造业,将以技术改变企业管理、组织架构及产业结构。本文旨在通过理论分析与实践评估,初步探讨具身智能重塑制造业企业工作流与产生格局的逻辑,为其深入发展提供战略意见和理论支持。本文主要回答以下几个核心问题:探讨具身智能的核心技术及具身智能在制造业中的应用场景有哪些?如何用管理学理论解释具身智能重塑制造业企业发展格局?具身智能如何重塑制造业企业工作流及变革制造业发展格局?具身智能发展有哪些难点与挑战?加快具身智能发展应提出哪些对策建议?
具身智能成为通向通用人工智能最值得探索的技术路线之一
具身智能是指能够与环境(人类环境与物理环境)交互,通过交互感知、学习、分析,掌握一项新技能,且进一步生成新知识的一类人工智能。早在1950年图灵便指出人工智能实现路径或可有两条,一是教会机器人下象棋(抽象计算),二是赋予机器感觉器官,教会其学习并听懂语言。它们分别代表了两类人工智能“学习”方式,前一种人工智能实现依靠“给予智能任务”,以“专家系统”与人工神经网络为代表。第二种则为“赋予智能能力”,认为智能行为应在行为主体与环境的交互过程中产生,倡导智能应是是具身化和情境化的具身智能。
近期本体硬件、智能体感知与训练方式等在智能传感器、人形机器人、大模型算法、多模态技术、仿真及动态捕捉等各技术领域实现突破,使具身智能成为发展通用人工智能最具前景的技术路线。具身智能技术实现包含两个部分(见图1):一是在物理或者虚拟世界进行交互和任务执行的本体;二是置于本体之上的智能核心,即智能体,用于实现感知、理解、决策和控制等核心工作。具身智能实现需要集成本体对环境感知、与环境交互和执行操作的能力;以及智能体理解与分析、自主决策与控制精细动作、迭代学习的能力。本体硬件上,以各类传感器为核心部件形成基础交互系统,人形机器人提供机械身体实现基本运动控制,可作为具身智能其中一种行为载体(见图2)。智能体中,预训练大模型实现突破,成为机器从文本、图像、视频、音频等多模态信息中学习的基础。研究人员致力于结合大语言模型与多模态技术,为具身智能提供处理视觉信号、语音与自然语言信号的交互感知能力。比如具身视觉语言模型Google PaLM-E、NvidiaVIMA、Google Deepmind RT-X,算法处理通过大模型整体调度+小模型精调方式使机器实现具体任务。控制与执行训练目前存在虚拟仿真与动态捕捉两类方法,虚拟仿真类似于强化学习和无监督学习,通过在模拟器中不断尝试最终找到策略,目前该方法对训练机器习得用小脑执行的“本能”任务非常有效,训练情境有英伟达元宇宙仿真场景平台Omniverse等。而对于现实世界复杂问题,目前采取动态捕捉+遥操作方法模仿人类的“控制”行为,实体环境中Tesla Optimus和腾讯 Robotics X等人形机器人均采用该种方式训练(见图3)。
具身智能重塑制造业企业工作流的管理学理论
具身智能是技术进步的产物,其可影响企业资源配置、组织管理与战略制定,重塑制造业企业工作流。
随着大数据、云计算、人工智能等技术发展,新兴技术群——智能技术群逐渐形成。制造-服务融合成为新的生产组织形式,开放、协同、共享的创新生态系统得以构建,制造业企业的数字化转型以及平台企业的发展为其中最典型的表现形式。新兴技术冲击制造业企业管理模式,引发了学者对于“智能化管理”理论的思考。部分学者提出人工智能技术难以实现管理智能化,原因在于基于大数据训练的深度学习技术并无自主纠偏能力,难以真正替代人类从事脑力劳动。这为具身智能变革现有制造业企业工作流的管理理论提供新的思路。
具身智能的引入可能会对现有的组织结构、工作流程与企业文化产生深远的影响,其核心是全面自动化与人机协同。一是具身智能参与制造业企业管理的核心是交互式管理,其中包括人机交互与机器间交互。二是具身智能作为生产设备参与生产,生产与管理能够自学习、自适应、自迭代,实现生产决策的因素穷尽与生产环节的持续优化。三是具身智能与人类协同的组织结构转型,具身智能渗透进入人力资源管理、财务管理等管理决策中。组织架构转变为,人类专注于具身智能技术研发与应用,具身智能则管理生产。
具身智能重塑制造业企业工作流
具身智能的不断发展,其在制造业中的应用逐渐深入,带来了对工作流的全面重塑。这种重塑不仅体现在生产效率的提升,还涉及生产函数的变革、人机关系的重构以及制造范式的转型。
具身智能重塑生产函数
具身智能成为数据生产要素的“矿山”与“开矿工具”,将会改变生产要素中劳动力要素结构,重塑生产函数。
一是具身智能成为挖掘数据要素的 “开矿工具”和数据“矿山”。数据作为新型生产要素快速融入生产、分配、流通、消费和社会服务管理等各个环节,具有无限性、非排他性、边际效益递增性等特性。具身智能在交互中习得,有自挖掘、自遍历、自学习、自生成、自迭代的特点,通过交互感知“开采”多模态信息数据,并不断迭代学习生成新信息数据。比如,具身智能通过安装在生产设备上的传感器,能够实时监测设备的运行状态和生产线的操作情况,并通过自学习机制优化生产参数,在生产过程中实时获取、处理和分析多模态数据。这种能力使得具身智能不仅生成新数据,成为数据“矿山”,而具身智能也能充当“开矿工具”,不断挖掘出新的数据价值,突破“数据瓶颈”。比如西门子公司推出的的开放式物联网(IoT)操作系统“MindSphere”支持各来源实时操作数据的分析。
二是具身智能替代人力劳动,变革生产要素中劳动力要素结构。具身智能通过捕捉与学习实现控制与执行,替代如加工组装与搜索匹配等通过动作模仿和逻辑推理而完成的生产工作,改变劳动力生产要素结构。比如特斯拉“Optimus”机器人在生产线上能够代替人工完成复杂的装配任务,不仅提高了生产效率,还减少了因人工失误而导致的次品率。部分工作岗位被具身智能系统替代。
具身智能变革人机关系
传统制造业中,机器往往作为人类工人的辅助工具,主要承担重复性和危险性的任务。具身智能的出现使得机器从“工具”转变为“合作伙伴”,开启了人机合作的新纪元。
一是具身智能实现人机交互智能化,交互习得并参与生产及决策。目前制造业生命周期多个环节中应用分析式人工智能作为生产管理辅助工具,比如Back2CAD CADGPT辅助研发设计与规划;商汤AIDC、创新奇智AInno-15B工业大模型辅助生产制造;用友yongpt辅助经营管理;国光电器智能音箱Vifa ChatMini辅助产品服务优化等。亚马逊仓库机器人能够实现通过语音与工人交流并根据指令调整货品位置。
二是从辅助生产走向合作生产。人类设计、生产并管理具身智能,具身智能替代人类实现其他产品设计和制造,人机合作成为制造活动主体。具身智能融合云、AI与物理世界,具有理解力、交互力、规划和决策能力及可调本体形态,不同形态智能本体设置于生产各环节,通过具身智能设备之间、具身智能设备与工作人员之间连接与交互,实现原料到产品、厂内设备和厂外设备、设备和人员,生产、销售、配货和售后全路径贯通,具身智能自主安排生产计划、优化制造流程、自检生产设备、监督生产过程,并反馈信息不断迭代,完成生产制造全流程。比如在现有的人机合作生产的宝马汽车的装配线上,已经实现制造过程中具身智能与人类工人的部分协作。工人主要负责复杂决策和灵活操作,而具身智能则负责重复性和高精度的任务。通过这种人机合作模式,宝马显著提高了生产效率,并缩短了新车型的生产周期。
具身智能变革制造范式
具身智能的应用推动了制造业从传统的有限柔性生产向全面柔性生产的转型,进而实现了定制化规模生产和产用融合的制造范式。
一是具身智能参与其他产品生产,实现全面柔性生产。传统制造业中的柔性生产通常是有限的,即在一定范围内允许生产线对产品规格进行调整。然而,具身智能的引入使得全面柔性生产成为可能。具身智能能够实现生产端与用户端无阻连接,其感知并发掘消费者需求并设计与提供相应产品,由用户需求驱动产品开发和制造,实现工厂内外互联的创成式设计(Generative Design),以需求指导生产,实现全面产用融合、供需协同与定制化规模生产。并且,具身智能通过实时感知市场需求的变化,并根据需求调整生产计划和工艺流程。比如GE的“Predix”对生产各环节的实时监控,并通过数据分析预测潜在故障风险,提前布局维护。
二是负责生产具身智能的新型制造业部门能够实现自我迭代。包括具身智能本体制造部门以及具身智能生产设备制造部门。比如具身智能本体制造部门中,有智能传感器制造部门,其中涉及传感器芯片、传感器及其仪表的设计、生产及整机制造;也有具身智能机器人制造部门,涉及基础电机、减速器、控制器到灵巧手等制造。交互感知基础是各形态具身智能本体,具身智能本体生产集群涉及材料、机械工程、生物医学等学科,其本身也可迭代学习并设计制造更适配的具身智能本体设备。比如西门子公司推出能够实现产品、工厂、系统和机器的互联的开放式物联网(IoT)操作系统“MindSphere”。
具身智能变革产业发展格局
具身智能的发展不仅影响了制造业企业内部的工作流,还对整个制造业的产业格局产生了深远影响。其通过变革产业间关系、促进制造业与服务业的融合、重构全球供应链以及引领产业标准化,重塑制造业发展格局。
具身智能的未来是制造业与服务业全面融合
具身智能变革制造业与服务业关系。一是具身智能与制造业融合的未来是制造业与服务业全面融合。具身智能参与产品制造与服务提供,意味着工业经济时代大规模生产下专业化分工的产业边界逐渐模糊。制造业与服务业全面融合意味着以制造业部门占GDP比重作为衡量制造业发展水平的衡量标准失效。制造业仍发挥着引擎作用,制造业发展水平评价体系应向适配智能制造发展趋势演进,比如以具身智能使用强度作为制造业发展水平衡量标准之一。二是具身智能发展过程中变革制造-服务相对关系。作为通用目的技术,具身智能全行业赋能,导致因服务业相对生产率增速缓慢,所引起服务业占比扩大、经济增速减缓的“鲍莫尔成本病(Baumol's disease)”得以克服。具身智能赋能服务业,使其生产率爆发式增长,并向劳动力节约型行业转型。制造-服务相对价格变化会造成各行业相对规模变化,制造业与服务业全要素生产率增长率差值缩小,服务业相对价格上涨速度减缓,进一步使得服务业比重相对上升速度与制造业比重相对下降速度均减缓,保持制造业比重相对稳定。
具身智能重构全球产业链
一是强化全球产业链韧性。实时数据采集与分析、智能决策支持等功能,使得供应链管理更加高效和精准。具身智能的应用增强了全球供应链的弹性和敏捷性,使得企业能够更快速地响应市场需求和突发事件。比如亚马逊全球供应链网络,实现了高度自动化和智能化的库存管理。特斯拉优化了其供应链管理系统使其能迅速调整生产计划,以应对新冠疫情期间物流中断和零件短缺问题。
二是具身智能推动产业链垂直整合及区域协调。具身智能广泛应用使得制造业企业内部、上下游企业之间、同类企业之间信息互通,制造企业能够好地控制生产过程,根据供需调整生产计划,缩短产品上市周期,响应市场需求,灵活处理库存。对全球供应市场的信息处理使得制造业企业能够高效管理区域化生产和供应链,形成区域智能制造集群,并构成全球化的产业生态体系。
三是具身智能推动产业标准化。产业标准化与具身智能的广泛运用是互相推动的。标准化推动具身智能技术普及,使得国家和地区快速适应这一新兴技术。而具身智能本身可自我学习,能够助力应用该技术的相关部门的产业标准化。
具身智能发展的难点与挑战
随着大模型泛化能力进一步提升,各种具身方法和智能体将不断涌现。然而实现具身智能会面临数据、算法、工程技术、场景、复杂软硬件、算力、量产等诸多等待解决的问题和挑战。
技术的演进与突破
目前的人工智能技术,已经在虚拟空间中实现生成式人工智能,具身智能与之不同之处在于:一是具有物理世界的执行力,二是具有可成长空间,三是具有对事物、行为的主观能动性。经由具身智能走向通用人工智能的技术演进之路,核心是如何使人工智能“像人一样”拥有本能及智慧。
然而目前仍存在以下多种技术问题。一是包括传感器技术、芯片设计、人形机器人等在内的关键硬件技术仍无法实现具身智能的“感受”与 “感知”。具身智能的传感器需要通过物理反应、化学反应,最后传到智能体“大脑”,才能实现真正的“感受”,这是具身智能能够开始“学习”的先决条件,也是获取信息的重要来源。那么技术上如何实现传感器把听觉、视觉、触觉等多模态的信息压缩成一个个信息单元,传输到“大脑”中呢?机器本体设计,涉及基础电机、减速器、控制器等关键零部件,目前仍未形成模块化的生产流程,硬件和材料能否实现规模化生产,从而降低成本呢?芯片设计上,具身智能与动态环境交互,需要具备对实时大数据流处理、高并发、稳定性与能效的复杂需求,何种计算框架才能达到呢?
二是构建一个高效畅通、高度通用的软件生态充满挑战。具身智能系统融合了环境感知、物理交互和任务执行等多方面的功能,涉及智能体到本体的相互连接、传输的各类组件,这意味着其任务必然是具身智能“软件集”所驱动,而目前包含多模态感知、多任务适应、实时反应、自主学习迭代能力的软件系统尚未形成。
三是需要结合合成数据及真实世界数据突破“数据瓶颈”。为使具身智能习得复杂知识、完成复杂任务,可以以互联网数据训练大模型、以仿真数据训练精细动作、以标注数据习得具体任务。进一步地,从与真实世界的交互中,学习并迭代出新数据。而当前面临数据采集困难、数据模拟成本高的问题。
应用场景的拓展与深化
一是新技术创新需要解决如何创造商业价值的问题。具身智能技术如何实现应用的落地、成果的转化?如何把成本降低?如何确保收益的可持续性?如何解决在复杂不可控场景的“泛化”问题?
二是如何实现多种应用场景协同发力。目前布局具身智能研究及生产的有以特斯拉、比亚迪等为代表的车企,车企具有长期工业制造的经验,集成了成本控制、生产供应链、后端销售等商业能力;谷歌、亚马逊、BAT等互联网公司能以最快的速度触达和感知市场需求;波士顿动力、Figure 01等机器人公司除了产品本体制造外之外,也拥有强大的数据智能能力。三类企业该如何互补合作,实现产投协同?
全球竞争与合作
具身智能作为能影响全人类发展的尖端技术,在全球技术研发的过程中往往会面临竞争与合作的问题。一是我国发展具身智能面临极其复杂的国际局势。目前我国高端芯片采购使用受阻,算力竞争力发展受到一定抑制。美国升级对华芯片及芯片制造工具出口禁令,国产芯片产量大但存在未突破关键技术。通用大模型在理论研究、技术创新以及应用实践方面,仍有较大进步空间,且存在研发、训练、使用成本过高问题。二是面对如此复杂的国际环境,如何在竞争中取得产业标准化与技术规范的主导地位,以巩固本国在具身智能领域的市场地位?
伦理与社会挑战
具身智能技术进步与社会价值存在一定冲突。一是隐私与安全问题,具身智能在采集和处理个人数据时,会对隐私安全保护带来挑战;二是具身智能替代制造业中低技能劳动,存在大规模失业及社会不稳定的风险;三是技术伦理和责任分配问题,当具身智能可以交互、学习、思考、决策,无人监督时自主决策过程中的伦理问题也日渐凸显,意味着可能存在错误决策的责任分配问题,责任分配也将成为重要的法律和伦理问题。
加快具身智能发展对策建议
发展具身智能,需要在控制风险的基础上寻求技术突破,因此提出以下加快具身智能发展对策建议。
以应用落地塑造技术演进方向
具身智能技术演进具有应用和技术双轮驱动的特征,中国以完备工业体系与丰富应用落地场景为根基,从终端应用回溯激发技术创新,用业界应用落地需求塑造科技演进方向。美国拥有领先的人工智能芯片、算法、机器学习等核心技术,而中国优势在于完备工业体系下丰富应用落地场景。因此,政策应引导行业应用先行,由应用端数据回环,来带动具身智能技术突破、实用性增强及技术迭代。一是挖掘先进制造业中具身智能应用场景先行先试。挖掘装备制造、仪器仪表、集成电路和生物医药等先进制造业生产中瓶颈问题和可智能化生产流程,优先探索工业大脑、机器人协助制造、机器视觉工业检测、设备互联管理等智能场景。二是以具身智能自学习实现应用领域拓展。制造业场景中部署具身智能集合高质量垂域数据,用于训练工业大模型进而让智能体自我进化。三是政府治理和民生领域需求拉动具身智能发展。使用具身智能辅助政府决策、政府治理及民生保障,助力决策前瞻化、科学化,社会治理精准化,公共服务高效化。使用具身智能辅助潜在风险研判和防范,维护人民利益和国家安全。同时以保障和改善民生需求拉动具身智能发展,创造智慧工作方式与生活方式。
以技术创新增强解决方案实现能力
具身智能实现大规模商用落地,需要多学科互补式技术创新,以平台级通用解决方案加特定领域创新实现应用泛化。一是增强多学科互补的技术创新能力,为不同具身智能应用场景适配解决方案。材料、机械工程、数字产业、软件工程、自然语言处理、物理学(仿真)、生物医学等学科持续进行技术突破。二是技术创新需要平衡具身智能产业链中关键制造环节的可靠性、成本和通用能力,使技术演进方向满足大规模商用落地需求。构建产学联动科研团队,搭建制造业企业与具身智能科研部门互联平台,以规模效益控制通用具身智能产品应用成本。引导制造业企业和具身智能研发团队公开应用场景需求、技术创新成果和软硬件供需情况,助力具身智能实现具体应用。比如鼓励具有优秀运动能力和操作能力的平台级通用具身机器人产品生产,在此基础上,鼓励具身机器人在特定领域不同任务的设计和应用,尝试解决泛化和成功率问题。三是引导搭建具身智能科研实验室。通过虚拟和现实结合的具身智能交互环境,帮助具身智能不断进化实现技术演进。
以龙头企业带动具身智能生态构建
塑造头部企业研发通用、中小企业研发应用、政企联合建设基础设施的协同市场格局,以具身智能标准化体系打通技术关键节点。一是搭建由头部企业带动、多产业部门联合的标准化具身智能生态系统,有助于实现具身智能技术研发共创与技术创新涌现。具身智能产业发展具有规模效应,头部企业稳定资本投入、完备商业化计划、完善组织人才架构成为具身智能产业发展的关键。鼓励大企业 “头雁”先行,主导通用具身智能大模型以及多个领域垂直大模型研究,领跑行业技术迭代。通过标准化打通具身智能产业中芯片和硬件、基础服务和算法框架、技术层以及应用层等各技术关键节点。二是鼓励人工智能龙头企业推出具身智能基础设施产品与解决方案,支持人工智能企业与政府联合建设具身智能基础设施。加强集成算力、MaaS(模型即服务)、智能网络连接设施和感知基础设施等具身智能基础设施建设。促使算力资源、数据服务和云服务向普惠化、广泛化、标准化方向发展。结合软件层面优化设计,使得支撑具身大模型训练的算力资源在集群硬件层面得以提升,实现以云方式提供智能服务。推进泛在智能网络连接设施与物联数通新型感知基础设施建设,实现人、机、物全面感知和泛在连接。
以法律监管和社会保障完善社会支持体系
完善算法与数据监管实现“价值对齐”,社会保障对冲具身智能就业冲击。一是立法加强算法的安全治理,规范具身智能遵从人类价值。目前具身智能难以“自然习得”表征以及抽象信息,也缺乏理解并学习世界结构与运行规律等“常识”的能力。监管应促进创新和依法治理相结合,规避复杂算法和黑箱机制所引发的错误信息、算法歧视、隐私泄露、虚假信息泛滥等科技伦理问题。具身智能数据管理需要统筹好国家发展和安全问题。二是以社会保障对冲 “具身智能换人”问题。具身智能应用会替代部分劳动者岗位,政策应引导具身智能对重复性劳动、危险性工作的主动替代;其他诸如数据输入和处理、客户服务和支持、翻译任务和报告撰写以及内容生成等工作分梯次分阶段替代,政府层面需加强社会保障制度,帮助居民再就业,做好兜底工作。三是处理好技术伦理与责任分配问题。
关于作者 | 曾昭睿:中国银河证券博士后科研工作站研究员;
周康林:清华大学经济学研究所硕士研究生;
柯罗马:清华大学心理与认知科学系博士生。
责任编辑 | 高菁阳(gaojy@sem.tsinghua.edu.cn)
《清华管理评论》联系方式
订阅、广告及商务合作
010-62788163
shanghl@sem.tsinghua.edu.cn
来源:清华管理评论