苹果把皮克斯的台灯变成了现实,但我们真的需要它吗?

360影视 2025-02-09 18:34 3

摘要:1986 年,史蒂夫·乔布斯收购了卢卡斯影业的电脑动画部门,创立了皮克斯动画工作室。谁也没想到,这个投资不仅让乔布斯成为动画界的传奇,更催生了一个经典角色——Luxo Jr.,一盏活灵活现的台灯。这个没有面孔却异常富有表现力的小台灯,也成为了皮克斯的标志性形象

1986 年,史蒂夫·乔布斯收购了卢卡斯影业的电脑动画部门,创立了皮克斯动画工作室。谁也没想到,这个投资不仅让乔布斯成为动画界的传奇,更催生了一个经典角色——Luxo Jr.,一盏活灵活现的台灯。这个没有面孔却异常富有表现力的小台灯,也成为了皮克斯的标志性形象。近 40 年后的今天,这个创意在乔布斯曾经领导的另一家公司——苹果,正在从银幕走向现实。

近日,苹果机器学习研究部门发布的一篇研究论文引起了广泛关注。论文展示了一款极具表现力的机器人台灯,其动作设计明显带有 Luxo Jr. 的影子。苹果的研究人员在论文中直接提到了 Luxo Jr. 的影响,这个选择或许也是他们对乔布斯的一种致敬。

图丨 Luxo Jr.(来源:WikiPedia)

更具亲和力的智能台灯

从硬件构成来看,这款实验性机器人采用了经过改装的 6 自由度机械臂(WidowX)作为基础平台,顶端安装了一个 3D 打印的半透明灯罩“头部”。这个“头部”内部集成了 LED 照明、激光投影仪和一个内置摄像头,底座还额外配备了一个朝下的外置摄像头用于环境感知。整个系统还配备了语音交互功能,能够倾听和回应用户的语音指令。

让这款机器人最与众不同的是其丰富的交互方式。它不仅能完成传统台灯的照明功能,还能进行一系列富有表现力的互动。例如,当用户询问天气时,台灯会先“看”向窗外收集信息,然后转回来汇报天气状况,这个看似简单的动作序列实际传达了信息收集和反馈的完整过程。当机器人收到超出其运动范围的指令时,它会表现出努力尝试的姿态——先犹豫地暂停,然后伸展机械臂表现出尽力的样子,最后低下头表示歉意,通过这种拟人化的动作序列让用户更容易理解和接受失败的结果。

在实验场景中,研究人员还展示了多种应用可能。比如在摄影场景中,台灯能根据用户的手势调整照明角度和亮度;在阅读场景中,它可以根据用户的阅读位置自动调整光照方向;在视频会议时,它能通过动态调整位置来保持最佳的拍摄角度。更有意思的是,当播放音乐时,台灯会随着节奏摇摆舞动,看起来很有生命力。

这些自然流畅的动作背后,是苹果研究团队开发的 ELEGNT 框架在运作。这个框架的名称代表“Expressive and Functional Movement Design for Non-anthropomorphic Robot”(非人形机器人的表达性与功能性动作设计),其核心思想来源于人类学和行为科学研究。研究者发现,人类在交流时,除了语言之外,身体语言和空间距离也传递着重要信息。即使是很小的姿势变化,也能传达出丰富的社交暗示。

图丨研究假设概述(来源:arXiv)

ELEGNT 框架将机器人的动作系统分为两个关键维度:功能性动作(Function-driven)和表达性动作(Expression-driven)。功能性动作主要解决“做什么”的问题,比如如何从起始状态到达目标位置,如何避免碰撞,如何优化运动轨迹等。这些问题可以用传统的运动规划算法来解决。而表达性动作则关注“怎么做”的问题,它考虑如何通过运动轨迹的细微变化来传达机器人的“内部状态”。

从原理上来看,ELEGNT 框架将问题建模为一个马尔可夫决策过程(MDP)。在每个时间步骤 t,系统状态 st 包含机器人关节角度、工具状态(如灯光开关)和环境状态。动作 at 定义了关节角度的变化和工具事件。奖励函数 R 由功能效用 F 和表达效用 E 两部分组成。通过调节这两部分的权重系数 γ,可以在任务效率和表达丰富度之间找到平衡。

为了实现丰富的表达能力,研究团队设计了一套完整的运动原语系统,主要包含两大类:动作语言学(kinesics)和空间距离学(proxemics)。

动作语言学原语包括:

空间特征:如点头、摇头、低头等基本姿势;轨迹特征:如动作的流畅度、优雅度等。

图丨表达性机器人运动的布局空间示意图(来源:arXiv)

这些基本原语可以组合产生更复杂的表达序列。例如,一个“表示同意”的动作可能包含“点头”姿势配合“适中的速度”和“流畅的轨迹”;一个“表示好奇”的动作可能结合“前倾”姿势和“缓慢的趋近”动作。通过精心设计这些动作序列,即使是一个简单的台灯也能传达出丰富的非语言信息。

苹果研究团队对 21 名参与者进行了用户研究,比较了仅有功能性动作和加入表达性动作两种情况下用户的感受。结果显示,具有表达性动作的机器人获得了明显更高的评分,用户认为它更富有吸引力、更像人类、更智能。特别是在社交导向的任务中,比如播放音乐或闲聊时,表达性动作的效果更为明显。

这项研究揭示了非人形机器人如何通过精心设计的动作,在不需要拟人化外形的情况下,也能与人类建立起自然的互动关系。正如皮克斯能让一盏台灯打动无数观众一样,苹果似乎也找到了让家用机器人更具亲和力的方向。

苹果的下一个战略要点——智能家居机器人

实际上,这款机器人的出现并非偶然。早在 2024 年 4 月,彭博社就曾报道,在 2024 年 2 月份终止电动汽车项目后,苹果正将更多资源投入到家用机器人和人工智能领域。由原本负责汽车项目的 Kevin Lynch 领导的团队,当时正在开发一款代号为“J595”的家用机器人产品。这个产品被设想为一个智能家居控制中心、视频会议设备和远程家庭安全工具的集合体。

图丨相关新闻(来源: 彭博社)

而这一产品的核心特征与现在展示的这款具有表现力的台灯机器人高度重合——都强调通过自然的动作来增强人机交互体验。这意味着,这款实验性的台灯很可能是苹果更大规模机器人计划的一个重要技术验证。通过台灯这种相对简单的形态,苹果可以在较低风险的情况下测试和完善其机器人交互技术。

此前的消息显示,苹果计划中的家用机器人将采用类似 iPad 的显示屏搭配机械臂的形式,预计售价在 1,000 美元左右,最早可能在 2026 或 2027 年推出,届时,全球智能家居市场规模或将突破 2,000 亿美元。而具有 Social AI(社交人工智能)特征的产品可能会成为新的增长点。

用精心设计的外貌、动作语言,让原本冰冷的机器展现出温度和情感,这种能力在未来的人机交互中将变得越来越重要。今年的 CES(国际消费电子展)已经明显体现出了这一趋势。特别是在家庭环境中,用户往往会对设备产生某种程度的情感依赖,而有表现力的动作设计恰好能强化这种连接。

图丨 CES 2025 上走红的情感机器人 Mirumi(来源:Yukai Engineering)

不过,单就这款台灯所提供的这种动作交互来说,其能否真正落地还有待考量。

一方面,6 轴机械臂和复杂的传感器系统必然推高硬件成本。如果它真的要商品化,那么如何在保持核心功能的同时实现合理定价,是其必须面对的问题。Vision Pro 的教训提醒我们,即使是苹果的忠实用户,也不会仅仅为了新奇的交互体验就接受过高的价格。何况,这种交互并不一定能让所有人接受——研究显示,不同年龄段的用户对表达性动作的接受程度差异显著,年长用户往往表现出较低的偏好。

另一方面,从目前智能家居的发展来看,用户的核心需求主要集中在功能便利性、场景智能化和设备互联互通等方面。虽然像小米、亚马逊这样的公司也在不断推出新的交互方式,但最终能够留存的往往是那些能够切实解决用户痛点的功能。目前市面上的扫地机器人之所以能够成功,正是因为它们很好地解决了这两个问题。

再以现有的智能台灯市场为例,核心功能依然主要围绕着远程控制、场景联动等实用层面。而类似语音交互、情感支持的功能,往往更多服务于儿童教育等垂直领域。苹果能否开创下一个方向,还有待时间检验。

当然,许多具有开创性的产品往往在发布之初难免会让人心生怀疑。iPhone 刚发布时,很多人也不理解为什么需要一个“全是屏幕”的手机。关键在于,iPhone 解决了手机交互的根本痛点,而现在的问题是,动作交互能否同样解决家用机器人领域的某个根本问题?

参考资料:

1.https://arxiv.org/abs/2501.12493

2.https://machinelearning.apple.com/research/elegnt-expressive-functional-movement

3.https://www.bloomberg.com/news/articles/2024-04-03/apple-explores-home-robots-after-abandoning-car-efforts

4.https://www.bloomberg.com/news/articles/2024-08-14/apple-pushes-ahead-with-tabletop-home-device-in-shift-to-robotics

5.https://venturebeat.com/security/evolving-threat-landscape-rethinking-cyber-defense-and-ai-opportunties-and-risk/

运营/排版:何晨龙

来源:DeepTech深科技

相关推荐