摘要:多年来,Liphardt 一直在尝试设计和改装机器人。当他牵着机器狗出现在公众场合时通常会遇到三种反应:孩子们非常兴奋并渴望拥有一条属于自己的机器狗;他们的父母则感到一丝不安;许多“婴儿潮一代”则试图假装视而不见。“他们会快步走过,仿佛心里在想‘这又是什么荒唐
Jan Liphardt 是斯坦福大学的生物工程学教授,但对许多生活在加州洛斯阿尔托斯的陌生人来说他是一位奇怪的人:他经常牵着一条机器狗在街上散步。
多年来,Liphardt 一直在尝试设计和改装机器人。当他牵着机器狗出现在公众场合时通常会遇到三种反应:孩子们非常兴奋并渴望拥有一条属于自己的机器狗;他们的父母则感到一丝不安;许多“婴儿潮一代”则试图假装视而不见。“他们会快步走过,仿佛心里在想‘这又是什么荒唐的玩意儿?’ ”Liphardt 说道。
在我的多次关于机器人的讨论中,我也发现大多数人倾向于分为这三个阵营,尽管我并未观察到如此清晰的年龄界限。有些人乐观而充满期待,希望未来的机器人能熟练地完成许多人类当前承担的任务,从烹饪到外科手术等等;而另一些人则感到担忧,担心机器人可能带来的失业风险、安全问题,以及在人类与机器人共同生活时可能面临的各种问题。
最后一个阵营,也是我认为人数最多的,那就是无感。从 1961 年通用汽车在新泽西的工厂首次安装机械臂开始,关于机器人将如何彻底改变社会的说法层出不穷,然而直到今天,大多数这样的承诺尚未成为现实。
不过在今年,我们有理由相信,即使是那些长期处于“无感”阵营的人,也开始关注机器人领域正在发生的变化。以下是几个值得注意的发展趋势。
机器人正在经历考验
人形机器人研发竞赛源于这样一个核心理念:世界是按照人类形态设计和构建的,而实现这种形态的自动化将会给机器人技术带来巨大的变革。该领域由一批直言不讳且充满乐观精神的企业家推动发展,其中包括 Figure AI 的创始人 Brett Adcock。该公司专注于开发制造人形机器人,目前估值已超过 26 亿美元,并已与宝马展开合作测试其机器人产品。
Adcock 最近在接受 Times 采访时表示:“最终,体力劳动将变成一个可选项。”马斯克同样是这一领域的重要推动者。他的公司特斯拉正在研发一款名为 Optimus 的人形机器人,马斯克宣称,这些机器人将创造一个“没有贫困的未来”。此外,另一家机器人公司 Eliza Wakes Up 已经开始接受预订,其开发的名为 Eliza 的人形机器人售价高达 42 万美元。
去年6月,Agility Robotics 将一批名为 Digit 的人形机器人部署到 GXO Logistics 公司(该公司为耐克、雀巢等企业提供产品运输服务)。这些人形机器人能够完成许多涉及搬运的工作,例如从托盘上卸货或将箱子放置到传送带上。
当然,这其中也面临一系列现实问题。例如,光亮的混凝土地板可能会导致机器人在行走时打滑,并且建筑物内需要有全面覆盖的高质量 WiFi 网络才能确保机器人正常工作,而更大的挑战在于充电。目前,Agility 的 Digit 机器人配备一块重达 39 磅的电池,每次充电可运行 2 到 4 小时,之后需要花费 1 小时进行充电。因此,在轮班期间频繁更换充满电的机器人成为常规操作。
理论上,如果充电站数量充足,这些机器人可以在工厂夜间停工时自主移动到充电站补充电量,但这种自主移动可能会意外触发建筑的安保系统。“这确实是个问题。”Agility 的首席技术官 Melonee Wise 如是说。
Wise 对人形机器人能否广泛应用于工作场所持谨慎态度,她表示:“我一直是个悲观主义者。”机器人在实验室里表现良好是一回事,但将它们投入到一个实际的、繁忙的仓库环境中则是另外一回事。这样的仓库里通常有大量工人和叉车,而且货物需要在紧迫的时间压力下完成高效搬运。
如果说 2024 年是人形机器人大量进入人们视野的一年,那么今年我们将真正见证这些机器人在现实环境中接受考验,并了解它们是否能如预期那样提高生产力。如今,随着 Agility 的机器人被部署到快节奏的客户设施中,很明显,即使是看似微小的问题,累积起来也可能对整体运行产生重大影响。
此外,人类与机器人共享工作空间也带来了额外的挑战。据 Wise 透露,在 GXO 的设施中,人类和机器人通常被安排在不同的工作区域,但一些特殊情况依然可能发生。例如,一名人类员工可能会无意中将物品遗留在充电站附近,导致机器人无法顺利返回充电站补电。这时,机器人需要向人类发出警报,要求清除障碍物,从而拖慢操作流程。
尽管人们常说,机器人不会请病假,也不需要医疗服务,但随着今年人形机器人被大规模投入实际工作场景,它们的真实局限性将逐渐显现。
从想象中学习
我们教机器人完成任务的方式正经历快速的变革。过去,我们需要将任务分解成多个步骤,用明确的编码指令逐步指导机器人完成。而如今,得益于人工智能的进步,机器人可以通过观察来自主获取指令。就像 ChatGPT 是通过接触数万亿句子学会写作,而不是直接学习语法规则一样,机器人如今也可以通过观看视频和观察示范来掌握技能。
这引发了一个重要问题:我们如何为机器人提供这些学习所需的视频和示范?
英伟达一直致力于通过虚拟世界来解决这一问题,这项工作建立在其深厚的视频游戏行业技术积累之上。英伟达构建了高度逼真的模拟世界,为机器人研究人员提供了一个测试平台。在这些虚拟环境中,机器人数字化的复制品可以进行大量训练。例如,一辆自动驾驶汽车可以在虚拟世界中行驶数百万英里,或者一个工厂机器人可以学习如何在不同的光照条件下导航。
去年 12 月,英伟达推出了一个名为“Cosmos”的世界基础模型,通过学习超过 2,000 万小时的视频来生成合成训练数据,为机器人提供大量的学习资源。
以下是英伟达模型在实际应用中的一个场景。假设你经营一家机器人公司,想要制造一个能够在医院清理环境的人形机器人,那么你可以利用英伟达的 Cosmos 模型构建这个机器人的“大脑”,让它具备基本的物理知识和对世界的理解。然而,为了让它在医院中真正发挥作用,你还需要让它熟悉医院的具体工作环境。传统方法包括在医院拍摄视频和图片,或者让工作人员佩戴传感器和摄像头记录他们的日常工作。
“然而,这种方法成本高昂且非常耗时,意味着你只能采集到数量有限的真实数据。”英伟达模拟技术副总裁 Rev Lebaredian 指出。而 Cosmos 模型可以通过这些有限的示例,生成一个完整的三维模拟医院。在这个虚拟环境中,模型能够引入各种变化,比如更换地板颜色、调整病床尺寸等,从而生成多种略有不同的环境。“如此一来,采集的现实世界数据会被扩展数百万倍。” Lebaredian 说道。通过这种方式,机器人不仅能够学习如何在特定的医院环境中运作,还可以适应各种可能的变化场景。
这种方式类似于机器人既从现实世界的经验中学习,也从虚拟环境中想象并扩展出更多可能性,当然,这种想象仍然需要严格遵循物理规则。
虽然通过人工智能和模拟训练机器人并非全新的概念,但随着技术的进步,这种方法正变得越来越经济和高效。
更聪明的大脑搭配更灵活的身体
机器人技术的许多进步都集中在提升机器人的感知和规划能力上,换句话说,就是优化它们的“大脑”。相比之下,改进机器人的“身体”进展较慢,而这直接影响到机器人在物理世界中的移动能力,尤其是在那些比受控装配线更为复杂且不可预测的环境中。
军事领域正致力于改变这一局面,并不断推动机器人在物理世界中可能性的边界。例如,美国海军正在测试由 Gecko Robotics 公司开发的机器人,这些设备利用磁力爬墙技术可以垂直攀爬墙壁,用于执行基础设施检查任务,包括检测航母上的裂缝、缺陷和焊接问题等。
其他的,以无人机为例,新技术已经将无人机的能力扩展到复杂的室内环境。例如,国防科技厂商 Xtend 获得了一份价值 880 万美元的合同,为五角大楼开发适应室内和城市环境的无人机。这些无人机能够在狭小空间中导航,并应对不可预测的布局,同时克服 GPS 信号失效的挑战。“这些系统的设计目标是克服战场上的极端环境条件。”Xtend 的联合创始人兼首席技术官 Rubi Liani 表示。根据计划,Xtend 在今年初将向五角大楼交付第一批无人机。
另一个备受关注的方向是水下无人载具的发展,美国计划投入超过 10 亿美元开发小型无人载具,重点是自主控制的潜艇和水面舰艇。
所有这些变化共同描绘了一个未来:机器人在学习方式、工作场所适应性以及物理移动能力方面将变得更加灵活和高效。
斯坦福大学的 Jan Liphardt 认为,这场变革的下一个突破口将是通过语音指令提升机器人的能力。得益于大型语言模型在理解和生成文本方面的卓越表现,这些模型已成为 Liphardt 与机器人之间的翻译工具。
他解释说:“我们可以对我们的四足机器人说,“‘嘿,你是一条狗’,然后它就会尝试模仿狗的行为,比如嗅探、吠叫。”他补充道,“接着,我们只需要改变一个词,比如告诉它‘你是一只猫’,它就会开始喵喵叫,还会跑开躲避狗。而这一切发生的背后,我们甚至不用修改任何代码。”
原文链接:
来源:麻省理工科技评论APP