标准化、有效性、通用性,具身智能数据集建设步入量质并重快车道

360影视 2024-12-30 17:18 2

摘要:自1950年由艾伦·图灵提出具身智能概念以来,经过70多年的探索实践,具身智能已经逐步走近人类生产生活的方方面面。作为具身智能的重要载体,具身智能机器人赛道今年异常火爆,受到学术、产业、资本以及各国政府的广泛关注与支持。

自1950年由艾伦·图灵提出具身智能概念以来,经过70多年的探索实践,具身智能已经逐步走近人类生产生活的方方面面。作为具身智能的重要载体,具身智能机器人赛道今年异常火爆,受到学术、产业、资本以及各国政府的广泛关注与支持。

正如ChatGPT需要海量文本数据来训练一样,高质量、多样化数据集是实现具身智能快速突破和具身机器人快速落地应用的关键。优质的数据集能够加速具身智能模型的训练与部署,帮助其控制各种类型的机器人遵循不同的指令,对复杂任务进行基本推理,并有效地完成这些任务。

但不同于大语言模型可以使用互联网海量信息作为训练数据,机器人所用的具身智能模型并无现成数据可供直接使用。一套符合通用标准、由模型验证有效且具备通用性的数据集,已成为当前具身智能行业最大的刚需。

2024年12月27日,国家地方共建具身智能机器人创新中心(以下简称“创新中心”)与北京大学计算机学院联合推出了一个大规模多构型具身智能数据集和Benchmark——RoboMIND,基于成型标准采集,经多个模型训练验证有效,支持多本体多任务并具备通用性,充分解决了目前全球开源数据集,量大但数据质量参差不齐、通用性复用性差、部分数据实测效果不理想等问题,有效满足复杂场景具身智能高效率和针对性的训练。

适用于多平台、多场景、多技能的数据集价值更大

当前具身智能本体形态多种多样,应用场景千差万别,对于具身智能训练数据的需求也更为多元。目前业内仍有部分数据集主要聚焦在特定机器人、特定场景和特定技能等方面,在整体通用性上有待提升。

创新中心发布的RoboMind数据集,采用了包括含单臂机器人、双臂机器人、人形机器人,手臂末端使用夹爪或者灵巧手等多种形态的机器人本体进行数据采集,包含了涉及279项不同的任务多类场景,涵盖了高达61种不同的物体,覆盖了家居、厨房、工厂、办公、零售等大部分生活服务场景,对科研突破和场景应用均十分友好。创新中心持续采集长程复杂任务,目前已经积累数十万条高质量数据,以真机数据为主,配以仿真遥操作数据。在数据质量与使用价值上,一条数据等同于目前现有数据集的多条存量数据。创新中心计划首批开源10万条,后续逐步释放,涵盖更多机器人本体和场景任务。

Robomind数据集多形态机器人,多场景验证

据谷歌Open X-Embodiment公开资料显示,其数据集汇集了来自各个机构的数据,整合了70余个独立数据集,合计百万量级数据片段,涵盖了从单臂机器人到双臂机器人,再到四足机器人等多种不同形态的机器人。值得一提的是,虽然OpenX发布数据集高达百万条量级,但是大小只有3TB左右,且数据质量和一致性差,真正可用的有效数据不足一半。此外,其实测效果较差,在其官方的小参数量模型(RT-1 35M)上,甚至不如原版RT-1的13万条数据训练的效果。创新中心本次发布的数据集大小是20TB,并且保证了所有数据的统一可用,在benchmark测试中大小模型已跑通了数据集中涵盖的所有机器人本体。

Open X-Embodiment 数据集的样本

多款模型验证有效,具身智能数据集迈入下一个阶段

当前市场上已有多家机构开源具身智能数据集,但由于是多个数据集整合,存在一定数据格式不统一,数据质量参差不齐,需要进行大量的二次调试、整合,难以有效满足复杂场景具身智能高效率和针对性的训练等问题,并且基于开源的数据集测试训练效果也不尽相同。经过验证后“能用”、“好用”的高质量具身智能数据集成为了行业关注的重点,也是许多高校、科研机构和企业重点攻克的难题。

创新中心发布的RoboMIND,已在主流单任务模仿学习模型(如ACT、BAKU)和具身多模态大模型(如OpenVLA、RDT-1B)进行了评测,经多本体和多任务的系统评测,证明RoboMIND数据集有效提升了模仿学习模型在现实场景下任务的成功率,率先进入了数据集使用的下一个阶段。

RoboMIND数据集实验验证

行业引领者,创新中心打造国内首个具身智能数据采集标准

具身智能数据采集需要投入大量时间和资源进行机器人操作实践或者仿真模拟,来收集视觉、触觉、力觉、运动轨迹以及机器人本体状态等多源异构数据。目前业内发布的数据集标准不一,存在数据质量参差不齐、数据通用性复用性差、部分数据实测效果不理想等问题。

今年11月,作为行业的引领者,国家地方共建具身智能机器人创新中心牵头立项《人工智能 具身智能 数据采集规范》工信部行业标准,这是国内第一个具身智能数据集的行业标准,规范了具身智能数据集采集的格式,使不同公司采集的数据可以互相共享开源,能够加速模型“涌现”。创新中心未来还将设计一系列数据集标准,为模型泛化保驾护航。

在12月的具身智能创新发展研讨会上,创新中心正式发布了《具身智能标准化研究报告》、《具身智能数据集及评测研究报告》(即RoboMIND)两项重磅报告,为行业的标准化与数据集建设提供指引。具身智能数据集采集标准的建立将进一步明确具身智能数据要求及质量等,从而加速具身智能行业的良性发展。

作为训练具身智能大模型的重要原料,数据集采集是否符合标准、在训练上是否“能用”、“好用”,是否能更有效支持模型泛化,已经成为机器人变“聪明”的关键。本次创新中心数据集的开放和benchmark的发布,在标准化、有效性和通用性方面均给出了令人瞩目的突破性结果,并为此后行业的高质量数据集采集打下了坚实基础。具身智能行业有望以此为开端,在2025年实现更多的落地应用。

来源:尚工机器人一点号1

相关推荐