【智能时代】具身感知:亿万年生物演化史,机器人智能进化关键

360影视 国产动漫 2025-03-24 08:31 3

摘要:AI为核心的新一轮科技创新浪潮已至,AI将与互联网一样,带来新一轮范式革命,人类社会将进一步加速发展。我们精心准备,重磅推出【智能时代专题】,目前已规划106篇深度原创研报,将全方位梳理AI产业、技术、代表性公司等发展历史、现状、趋势,展望智能时代未来图景,挖

AI为核心的新一轮科技创新浪潮已至,AI将与互联网一样,带来新一轮范式革命,人类社会将进一步加速发展。我们精心准备,重磅推出【智能时代专题】,目前已规划106篇深度原创研报,将全方位梳理AI产业、技术、代表性公司等发展历史、现状、趋势,展望智能时代未来图景,挖掘投资机会。

智能时代专题:具身感知

免费版2,665字,预计阅读5分钟

完整版18,235字

智能时代第二季,重磅升级,更前瞻,更硬核,支持专题/单篇付费解锁

一、从生命起源,到AI浪潮,感知能力推动智能进化。

地球诞生至今已经46亿,地球刚诞生5亿年后,第一个原核细胞,也就是最简单的单细胞出现。从第一个原核细胞诞生之后的20亿年时间里,地球生命逐渐遍布海洋与陆地,虽然形态、生存方式千差万别,但原核生物生理构造一直原地踏步,生理上一直维持非常简单的单细胞形态,没能往复杂化进化,甚至没能进化出多细胞形态与复杂生命。

直到大约20亿年前,第一个真核细胞出现在地球上,真核细胞具有成形细胞核。原核生物向真核生物转变,是地球生命史上最重要的范式转变,这次突破,真正打开生命向复杂化演化的大门,加速开启生命进化新篇章。从那之后,复杂的多细胞生物,包括真菌、植物、动物、人类才陆续出现,才有我们今天看到的世界。

地球生命演化史,也是感知能力不断迭代升级的历史。生命进化时间轴看,感知能力出现,大致遵循从简单到复杂、从基础到高级顺序;最早出现的是简单化学感知与物理感知能力,趋化性(化学信号感知)、趋光性(光感知)等;随着生物体结构复杂化,逐渐演化出更高级感知能力,触觉、视觉、听觉等。

约5.4亿年前,寒武纪大爆发时期,视觉感知系统出现,是生物感知能力重大飞跃,捕食与逃避,竞争与生存,使得生物进化加速,为诞生智能创造条件。视觉出现,促进生物间相互竞争、协同进化,对整个生态系统结构产生深远影响。寒武纪大爆发时期,众多新生物种类,雨后春笋般涌现,形成海洋生物异常繁荣景象。

视觉出现,是生命智能萌芽的关键节点,开启生命对世界系统性认知与理解之门。视觉出现后,生物开始能对环境进行更全面、深入观察与分析,促进大脑进化与神经系统复杂化,逐渐形成更高级认知能力。认知能力提升,推动生命从简单的本能反应,向更复杂智能行为进化,成为生物智能诞生基础。

地球生命演化史,到现在AI浪潮,感知能力始终是推动智能进步关键因素。自然界中,生命、意识、智能之间,存在紧密联系;有了生命,慢慢进化出意识,意识以感知为基础;意识不断发展与强化,进化出智能,智能是系统化的意识,生命是意识与智能的载体。

这一规律,为AI发展提供重要启示:无论碳基生命,还是硅基智能,感知能力不断提升与拓展,都是适应环境、解决问题、实现进化的重要推动力。

2012年,ImageNet挑战赛为标志,全球开启新一轮深度学习浪潮,以计算机视觉取得突破性进展为开端。类似视觉是生物智能进化重要基础,计算机视觉突破,为AI向更高水平发展打下基础。

二、人类感知系统进化过程,从生物适应,到AI时代人机协同。

人类进化历程中,感知系统迭代,是生物适应与文化创造共同结果,核心优势在于感知系统多模态融合与认知可塑性。

从原始古猿,到现代智人,人类感知能力不断进化,触觉精细化,促进工具使用,视觉系统通过立体成像提升空间定位能力,听觉系统发展出语言解析功能,大脑将多种感知信息融合,不仅使人类适应复杂多变自然环境,更为人类文化创造与社会发展打下基础。

人类各种感知能力,自然界中都不算最强,大脑能对各类信息进行深度处理,形成复杂认知模式,这是人类独特优势。

相比AI,人类知识传承存在低效性,主要源于个体学习的生物学限制、知识分享困难、知识积累复杂性等,一定程度影响人类进化速度与创新能力发展。

相比人类,AI与机器人发展,有望实现群体智能,突破单体能力边界,推动加速进化。机器人群体作为整体,可实现单个机器人个体无法完成的复杂任务,展现出更高层次智能水平。很多机器人,可共用一套智能系统,知识分享瞬间实现,无需像人类经历漫长学习与分享过程。机器人群体智能具备涌现性,群体能力并非个体智能简单叠加,而是个体相互作用产生协同效应,展现出1+1>2、甚至是X*X的智能涌现效果。

人类在认知与创造方面,具备独特优势,包括隐喻认知、道德判断、审美创造等方面,为人类思考、决策、艺术表达,提供独特视角,是AI与机器人不具备的能力。

未来,人类进化方向,可能在人机协同,将人类概念化能力与AI数据处理优势相结合,开创人机融合新纪元。

三、从生物启示,到多模态融合,机器人具身感知成为趋势。

机器人感知能力,很大程度借鉴生物学,尤其是人类感知系统。人类通过触觉、视觉、听觉、嗅觉、味觉等多模态感官系统,获取环境信息,基于神经网络动态整合实现高效决策。

机器人通过硬件传感器与算法协同,复现、扩展这一能力,实现具身感知,本质是机器人信息获取过程,让机器人能充分、高效获取外界信息,支持后续决策与执行,是机器人智能进步的基础。

机器人已具备一定视觉、听觉、触觉等感知能力,这些能力通过集成各种传感器部件实现,未来这些能力将进一步大幅提升,通过多模态融合,真正实现类似人类的具身感知。这些新感知能力加入,将使机器人感知全面达到、超越人类水平,让机器人拥有更泛化、更丰富交互能力。

四、机器人具身感知的技术实现,基于软硬件融合,驱动智能进化。机器人具身感知系统核心架构,是传感器硬件与算法软件深度融合。

硬件与算法协同发展,推动机器人具身感知系统,从简单感知功能,向复杂的智能认知转变,不仅提升机器人在复杂环境下适应性与可靠性,还拓展在更多领域应用场景,为机器人技术持续发展打下坚实基础。

当前机器人具身感知算法领域,尚未形成统一技术标准,头部公司与研究机构基于自身技术积累与应用场景需求,形成差异化解决方案。

机器人多模态感知技术,呈现百花齐放格局,核心算法主要围绕强化学习RL、视觉语言模型VLM、视觉语言动作模型VLA、端到端架构、多传感器融合算法、仿真训练等展开,世界模型等是前沿方向。

视觉语言模型VLM、视觉语言动作模型VLA,推动机器人突破场景理解技术天花板。

理想发布下一代自动驾驶架构MindVLA,迈向自动驾驶物理智能体关键一步。MindVLA是通用框架,不仅用于自动驾驶,也适用其他物理智能体。理想内部评价MindVLA,将类似Deepseek给其他AI应用带来变化,赋能其他现实世界物理智能体。

2025年3月18日,英伟达GTC 2025上,理想发布下一代自动驾驶架构MindVLA最新思考与进展。MindVLA是视觉-语言-行为大模型,理想内部称为机器人大模型,将空间智能、语言智能、行为智能统一,让自动驾驶拥有感知、思考、适应环境能力,是通往L4路上最重要一步。

MindVLA能为自动驾驶赋予类似人类的驾驶能力,将汽车变为能够思考的智能体,实现听得懂、看得见、找得到。就像iPhone 4重新定义手机,MindVLA将重新定义自动驾驶。未来MindVLA跑通物理世界与数字世界结合范式后,将有望赋能更多行业。

理想创始人李想介绍,规则算法的能力是昆虫,端到端E2E是聪明的猴子,VLA机器人大模型具备人类理解物理世界的脑系统。通往全自动驾驶没有捷径,比LLM更难,这是理想要做预训练与基座模型,要把空间、语言、行为的Token统一在一个基座中训练的原因。

相关研报:

国家经济、投资的范式变化:从碳基经济到硅基经济,AI寒武纪大爆发时刻

【智能时代】现象级游戏《黑神话:悟空》的思考,游戏二元属性,文化与科技

【智能时代】自动驾驶:汽车iPhone时刻,中国三大流派演化形成中

诸神之战:美国科技巨头,从春秋五霸进入战国七雄|GBAT 2023 大湾区智能时代产业峰会

人类未来文明三部曲之二:智能时代专题预售开启,奇点临近,未来已来

九宇资本赵宇杰:智能时代思考,认知思维,存在原生、降维、升维三波认知红利

九宇资本赵宇杰:智能时代思考,以史为鉴,科技浪潮,从互联网到AI

九宇资本赵宇杰:智能时代思考,宇宙视角,从碳基生物,到硅基智能体

人类未来文明三部曲之一:元宇宙专题预售开启,59期45万字

九宇资本赵宇杰:1.5万字头号玩家年度思考集,科技创新,无尽前沿

九宇资本赵宇杰:1.5万字智能电动汽车年度思考集,软件定义,重塑一切

【重磅】前沿周报:拥抱科技,洞见未来,70期合集打包送上

【重磅】六合年度报告全库会员正式上线,5年多研究成果系统性交付

【智能电动汽车专题预售】百年汽车产业加速变革,智能电动汽车时代大幕开启

【头号玩家第一季预售】:科技巨头探索未来,头号玩家梯队式崛起

【头号玩家第二季预售】:科技创新带来范式转换,拓展无尽新边疆

【首份付费报告+年度会员】直播电商14万字深度报告:万亿级GMV风口下,巨头混战与合纵连横

【重磅】科技体育系列报告合集上线,“科技+体育”深度融合,全方位变革体育运动

【重磅】365家明星公司,近600篇报告,六合君4年多研究成果全景呈现

九宇资本赵宇杰:CES见闻录,开个脑洞,超级科技巨头将接管一切

【万字长文】九宇资本赵宇杰:5G开启新周期,进入在线世界的大航海时代|GBAT 2019 大湾区5G峰会

九宇资本赵宇杰:抓住电子烟这一巨大的趋势红利,抓住产业变革中的变与不变

【IPO观察】第一季:中芯国际、寒武纪、思摩尔、泡泡玛特、安克创新等11家深度研报合集

【IPO观察】第二季:理想、小鹏、贝壳、蚂蚁、Snowflake、Palantir等12家公司深度研报合集

【IPO观察】第三季:Coinbase、Roblox、快手、雾芯科技等12家公司深度研报合集

【重磅】年度观察2019系列合集:历时3个多月,超20万字近500页,复盘过去,展望未来,洞悉变与不变

【珍藏版】六合宝典:300家明星公司全景扫描,历时3年,210万字超5,000页,重磅推荐

九宇资本赵宇杰:对智能电动汽车产业的碎片化思考

九宇资本赵宇杰:九宫格分析法,语数外教育培训领域的道与术

【2023回乡见闻录】90、00后小伙伴们万字记录,生活回归正轨,春节年味更浓

【2022回乡见闻录】20位90、00后2万字,4国13地,全方位展现国内外疫情防疫、春节氛围、发展现状差异

【2021回乡见闻录】22位90后2万字,就地过年与返乡过年碰撞,展现真实、立体、变革的中国

【2020回乡见闻录】20位90后2万字,特殊的春节,时代的集体记忆

【重磅】22位“90后”2万字回乡见闻录,讲述他们眼中的中国县城、乡镇、农村

六合君3周岁生日,TOP 60篇经典研报重磅推荐

下午茶,互联网世界的三国杀

5G助推AR开启新产业周期,AR眼镜开启专用AR终端时代

新商业基础设施持续丰富完善,赋能新品牌、新模式、新产品崛起,打造新型多元生活方式

【重磅】中国新经济龙头,赴港赴美上市报告合辑20篇

知识服务+付费+音频,开启内容生产新的产业级机遇,知识经济10年千亿级市场规模可期

从APP Store畅销榜4年更替,看内容付费崛起

新三板破万思考:新三板日交易量10年100倍?

九宇资本赵宇杰:科技改变消费,让生活更美好|2017 GNEC 新经济新消费峰会

九宇资本赵宇杰:创业时代的时间法则,开发用户平行时间|2016 GNEC 新经济新智能峰会

请务必阅读免责声明与风险提示

来源:六合商业研选

相关推荐