摘要:近期,The World Ahead 2025上刊登了“人工智能教母”、斯坦福 HAI 联席主任李飞飞的最新认识,李飞飞提出,了解世界如何运作是人工智能的下一步,人们将从大型语言模型(LLM)转向大型世界模型(LWM),世界模型的潜意识推理方面是人类乃至机器人
导读
近日,Physical Intelligence和星尘智能官方平台宣告牵手,在数据和模型层展开合作,推进通用人工智能进入物理世界,共筑世界模型。
近期,The World Ahead 2025上刊登了“人工智能教母”、斯坦福 HAI 联席主任李飞飞的最新认识,李飞飞提出,了解世界如何运作是人工智能的下一步,人们将从大型语言模型(LLM)转向大型世界模型(LWM),世界模型的潜意识推理方面是人类乃至机器人水平智能进化的先决条件,对于大型世界模型的研究将有望加强机器人对世界和真实规则连贯的理解,赋予机器人前所未有的感知能力,促使其再进化。
近日,机器人大讲堂注意到,星尘智能与Physical Intelligence(PI)分别在社交媒体上公布了一条长序列的做咖啡视频,两家明星企业就疑似官宣合作,正在共推机器人世界模型落地。
随后PI的公司高管还在推特上转发了视频,引起了众多关注和热议。Chelsea Finn 评论说:“来自于PI的首个重磅合作。” 足见PI对此次合作的满意和重视。
▍世界级合作展现融合可能性
世界模型被认为是通往AGI的一大关键路径,也为具身智能的通用化提供了重要基础。其通过预测未来范式对数字世界和物理世界进行深度理解,让机器人等智能体充分感知、预测、规划和适应复杂多变的场景。
星尘智能与PI的合作,可能是本轮人形机器人与具身智能浪潮中,首个跨国际企业对于世界模型的科研合作典范。两家企业的牵手,正致力于数据闭环和模型优化,或将是探路世界模型的创新实践,充分证明了在人工智能与机器人这一科技最前沿领域,唯有优势互补、合作创新才是推动技术快速进步的源动力。
企业成立时间不长、产品技术创新特性强、团队思维更前沿灵活,这可能是当下具身智能企业的主要特征。星尘智能与PI虽然都已经是业内的明星企业,但都仍属于创企范畴,星尘智能成立于2022年12月,PI更是成立时间不到一年。然而,两家企业却在短期都做出了吸引世界眼球的成绩。
官方资料显示,星尘智能自主研发的Design for AI(面向AI,DIFA)的软硬件一体化系统架构,将“AI智能”与“最强操作”强耦合,在具身智能数据获取上取得关键突破,让机器人在感知、认知到执行上高度仿人,能像人一样学习、思考和劳动,与人流畅智能地交互,使用人的工具和设备。其AI机器人S1 今年4月首发时就因“最强操作性能”引起广泛关注。
在8月举办的世界机器人大会上亮相时,搭载星尘模型的S1就已化身AI机器人助理,可以顺畅完成多个物理世界服务,例如为人类做好饭、给猫换粮换水,甚至饭后泡好茶,奏乐一曲舒舒心,然后弯腰整理孩子们的玩具。
PI同样凭借着一众明星技术团队仅8个月就迅速引起众多资本关注,最近以24亿美元估值完成了一轮4亿美元的融资,吸引了包括OpenAI、Thrive Capital、红杉等知名企业和机构。其正创建一个通用模型,有望将人工智能带入物理世界,使机器人能够在各种应用程序中执行任务,于10月31日最新发布了首款通用机器人基础模型。
PI可谓是拥有全球具身智能领域“最强创始团队”,联合创始人Sergey Levine现任UC Berkley电气工程与计算机科学系副教授,曾带领团队与谷歌联合开发RT系列机器人项目。另一位联合创始人Chelsea Finn是Stanford计算机科学与电气工程系助理教授,多任务元学习的先驱,曾指导学生开发了ALOHA项目。两位创始人均是通过交互学习推动智能体通用算法研究的领军人物。
理念相同或是两家企业能够迅速达成跨国际合作的关键因素,正如星尘智能创始人来杰在11月“智源论坛·2024具身与世界模型专题峰会”提到:“构建世界模型是星尘智能的目标之一。比起分蛋糕,更重要的是,我们一起把蛋糕做大。”
目前,机器人产业的发展正迎来一个拐点。此前,机器人曾局限于从事工厂的重复性任务,如今许多研究人员的目标是利用神经网络来开发反映人类身体甚至人类表现的机器人。与专门的工业机器人不同,人形机器人等形态具身智能具有多功能特性,这些自主机器人和多模态机器人的研发都是为了更多元化的创造力而设计,通用性使其未来可以应用于各种工作环境,包括农业、制造业、采矿业、医疗保健、教育、娱乐甚至国防等。
Gartner2025年十大技术趋势中指出,到2030年,80%的人类将在日常生活中与智能机器人互动,而目前这一比例还不到10%。
星尘智能来杰一直认为机器人正在走功能模型到世界模型的进化之路。星尘智能的设计理念也是“Design For AI”,即让机器人在真实世界中产生交互并收集数据,同时确保交互安全,减少伤害。
为此,公司成立以来,来杰一直致力于推动机器人与人工智能技术的融合,加快机器人产品落地到各类场景中。“数据、算法和算力是对人工智能起决定作用的三大重点。”来杰认为,算力决定了运算速度,数据好比学习资料,算法类似人类大脑的感知、判断、调度能力,以力觉、触觉和视觉等方面的数据为基础,加上大模型算法的持续进化,与机器人本体硬件融合,就能产生真正的“具身智能”。
具身智能必然是一个整体化工程,人形机器人与人工智能融合所形成的具身智能,以人形机器人为主要载体,具备身体感知和智能信息处理功能,创建了一个认知智能基础模型和物理智能基础模型落地现实世界的典范。这也使得两家企业一拍即合,在数据和模型层优化合作,有了当前视频中令人震惊的机器人操作和泛化能力表现。
▍具身智能带来的无限可能
机器人能在物理世界与模型之间收集数据、理解数据,再与物理世界交互,把结果反馈给世界模型。有了不断优化的先进世界模型,人形机器人才可以对所处的任何场景形成个人理解,从而更加稳健地进行交互。
在这次视频中,我们可以发现在PI具身模型加持下,Astribot S1能够更加轻松地根据指令执行各种任务,让机器人找到咖啡胶囊,顺畅操作胶囊咖啡机、拿取胶囊咖啡、打开咖啡机胶囊咖啡仓、制取咖啡,并应对各类人类干扰,任务全程丝滑流畅,毫无卡顿。
值得一提的是,在这段视频中我们还看到了机器人令人印象深刻的抗干扰和泛化能力,例如视频中当S1被指定制作Nopoli风味的咖啡时,其都能根据任务需求准确寻找并拿取Nopoli风味胶囊,无论胶囊被放在什么位置都可以顺利找出来,迅速调整策略并重新继续任务,又例如当工作人员随意放置杯子,S1也能实时识别和抓取,这意味着人形机器人与环境的链接更加稳固,并深入理解这些场景的细微差别。
S1强大的具身智能特性得益于星尘智能持续的技术积累,今年以来,星尘智能在软硬一体化系统架构上取得了重大突破,既有智能的大脑,也有了全能的身体,两者在S1上表现出强耦合特性,打造出“最强”家庭机器人。因此无论星尘模型,还是这次PI的通用模型,都能快速在S1上验证实现。
一方面,星尘智能强调软硬件融合能力,特别注重力、触、维度的信息收集和学习。例如S1在软件上支持视频、动捕及遥操作等多种数据收集手段,提升了机器人对于先验知识的学习和适应能力,并运用强化学习、模仿学习和多模态大模型等完成学习和训练,强化了对物理世界及其规律和动态特性的理解,使S1对任务的理解以及逻辑链构建更加清晰,在多模态感知、认知处理上有着显著优势,能更快完成陌生任务的环境感知、实时决策和运动协调。
另一方面,除了系统架构和软件层面,在执行能力关键的机器人本体侧,星尘智能从机器人硬件系统到底层控制设计都考虑到了场景适用性和足够的鲁棒性,让机器人能够在真实且常常不可预测和动态的环境中可靠地运行。其自主研发的刚柔耦合传动系统集成了控制、传感、传动与驱动等多个复杂子系统,为S1机器人提供了敏捷的动态操作能力、精准的力控性能、更多的智能交互执行等。
从双方合作展现的成果来看,功能更强大的机器人是世界模型落地的先决条件。星尘智能凭借其出色的面向AI设计的智能本体,展现了业界领先的泛场景通用操作能力,这不仅体现了其AI能力的提升,也体现了其智能本体的最强操作属性,为其走向具身智能创造了基础条件。
▍结语与未来
随着认知智能基础模型和物理智能基础模型的快速发展,机器人时代即将到来。如果星尘智能与PI的强强联合成真,基于星尘智能和PI携手对通用机器人模型的提升改进下,未来人们有望看到一个更加通用、灵活、智能的具身智能产品。
当以星尘智能为典型的更多新型AI机器人能够以较低成本和较高效率利用真实世界数据进行模型训练、从第一人称视角收集触觉、力觉、视觉、听觉等多维度的高质量数据,为世界模型的学习与执行提供更高维度的数据支持时,整个系统将不断优化,并借此拥有更强的泛化性能力,从而可以快速、高效有用的执行任务,拓宽机器人操作能力的边际。
这意味着星尘智能与PI的跨界合作,不仅有助于提升全球现有机器人产品的性能,还有望在此基础上,催生新的具身智能创新技术,并推动机器⼈从单⼀的工业应用向更多的日常生活场景扩展,未来可以在医疗保健、娱乐、教育等场景下成为人类的智慧互动新型工具,引领新一轮科技革命和产业变革,最终在规模化效应下驱动技术飞轮效应,实现让数十亿人拥有AI机器人助理的宏大愿景。
正如来杰所说:“我们的目标是通过构建一个更强大的世界模型,不仅提升机器人在当前任务中的表现,还能推动通用人工智能(AGI)的实现。我们期待与各位同行一起推动这一进程,为未来的智能世界贡献力量。”
来源:机器人大讲堂