摘要:AI为核心的新一轮科技创新浪潮已至,AI将与互联网一样,带来新一轮范式革命,人类社会将进一步加速发展。我们精心准备,重磅推出【智能时代专题】,目前已规划106篇深度原创研报,将全方位梳理AI产业、技术、代表性公司等发展历史、现状、趋势,展望智能时代未来图景,挖
AI为核心的新一轮科技创新浪潮已至,AI将与互联网一样,带来新一轮范式革命,人类社会将进一步加速发展。我们精心准备,重磅推出【智能时代专题】,目前已规划106篇深度原创研报,将全方位梳理AI产业、技术、代表性公司等发展历史、现状、趋势,展望智能时代未来图景,挖掘投资机会。
智能时代专题:具身感知
免费版2,665字,预计阅读5分钟
完整版18,235字
智能时代第二季,重磅升级,更前瞻,更硬核,支持专题/单篇付费解锁
一、从生命起源,到AI浪潮,感知能力推动智能进化。
地球诞生至今已经46亿,地球刚诞生5亿年后,第一个原核细胞,也就是最简单的单细胞出现。从第一个原核细胞诞生之后的20亿年时间里,地球生命逐渐遍布海洋与陆地,虽然形态、生存方式千差万别,但原核生物生理构造一直原地踏步,生理上一直维持非常简单的单细胞形态,没能往复杂化进化,甚至没能进化出多细胞形态与复杂生命。
直到大约20亿年前,第一个真核细胞出现在地球上,真核细胞具有成形细胞核。原核生物向真核生物转变,是地球生命史上最重要的范式转变,这次突破,真正打开生命向复杂化演化的大门,加速开启生命进化新篇章。从那之后,复杂的多细胞生物,包括真菌、植物、动物、人类才陆续出现,才有我们今天看到的世界。
地球生命演化史,也是感知能力不断迭代升级的历史。生命进化时间轴看,感知能力出现,大致遵循从简单到复杂、从基础到高级顺序;最早出现的是简单化学感知与物理感知能力,趋化性(化学信号感知)、趋光性(光感知)等;随着生物体结构复杂化,逐渐演化出更高级感知能力,触觉、视觉、听觉等。
约5.4亿年前,寒武纪大爆发时期,视觉感知系统出现,是生物感知能力重大飞跃,捕食与逃避,竞争与生存,使得生物进化加速,为诞生智能创造条件。视觉出现,促进生物间相互竞争、协同进化,对整个生态系统结构产生深远影响。寒武纪大爆发时期,众多新生物种类,雨后春笋般涌现,形成海洋生物异常繁荣景象。
视觉出现,是生命智能萌芽的关键节点,开启生命对世界系统性认知与理解之门。视觉出现后,生物开始能对环境进行更全面、深入观察与分析,促进大脑进化与神经系统复杂化,逐渐形成更高级认知能力。认知能力提升,推动生命从简单的本能反应,向更复杂智能行为进化,成为生物智能诞生基础。
地球生命演化史,到现在AI浪潮,感知能力始终是推动智能进步关键因素。自然界中,生命、意识、智能之间,存在紧密联系;有了生命,慢慢进化出意识,意识以感知为基础;意识不断发展与强化,进化出智能,智能是系统化的意识,生命是意识与智能的载体。
这一规律,为AI发展提供重要启示:无论碳基生命,还是硅基智能,感知能力不断提升与拓展,都是适应环境、解决问题、实现进化的重要推动力。
2012年,ImageNet挑战赛为标志,全球开启新一轮深度学习浪潮,以计算机视觉取得突破性进展为开端。类似视觉是生物智能进化重要基础,计算机视觉突破,为AI向更高水平发展打下基础。
二、人类感知系统进化过程,从生物适应,到AI时代人机协同。
人类进化历程中,感知系统迭代,是生物适应与文化创造共同结果,核心优势在于感知系统多模态融合与认知可塑性。
从原始古猿,到现代智人,人类感知能力不断进化,触觉精细化,促进工具使用,视觉系统通过立体成像提升空间定位能力,听觉系统发展出语言解析功能,大脑将多种感知信息融合,不仅使人类适应复杂多变自然环境,更为人类文化创造与社会发展打下基础。
人类各种感知能力,自然界中都不算最强,大脑能对各类信息进行深度处理,形成复杂认知模式,这是人类独特优势。
相比AI,人类知识传承存在低效性,主要源于个体学习的生物学限制、知识分享困难、知识积累复杂性等,一定程度影响人类进化速度与创新能力发展。
相比人类,AI与机器人发展,有望实现群体智能,突破单体能力边界,推动加速进化。机器人群体作为整体,可实现单个机器人个体无法完成的复杂任务,展现出更高层次智能水平。很多机器人,可共用一套智能系统,知识分享瞬间实现,无需像人类经历漫长学习与分享过程。机器人群体智能具备涌现性,群体能力并非个体智能简单叠加,而是个体相互作用产生协同效应,展现出1+1>2、甚至是X*X的智能涌现效果。
人类在认知与创造方面,具备独特优势,包括隐喻认知、道德判断、审美创造等方面,为人类思考、决策、艺术表达,提供独特视角,是AI与机器人不具备的能力。
未来,人类进化方向,可能在人机协同,将人类概念化能力与AI数据处理优势相结合,开创人机融合新纪元。
三、从生物启示,到多模态融合,机器人具身感知成为趋势。
机器人感知能力,很大程度借鉴生物学,尤其是人类感知系统。人类通过触觉、视觉、听觉、嗅觉、味觉等多模态感官系统,获取环境信息,基于神经网络动态整合实现高效决策。
机器人通过硬件传感器与算法协同,复现、扩展这一能力,实现具身感知,本质是机器人信息获取过程,让机器人能充分、高效获取外界信息,支持后续决策与执行,是机器人智能进步的基础。
机器人已具备一定视觉、听觉、触觉等感知能力,这些能力通过集成各种传感器部件实现,未来这些能力将进一步大幅提升,通过多模态融合,真正实现类似人类的具身感知。这些新感知能力加入,将使机器人感知全面达到、超越人类水平,让机器人拥有更泛化、更丰富交互能力。
四、机器人具身感知的技术实现,基于软硬件融合,驱动智能进化。机器人具身感知系统核心架构,是传感器硬件与算法软件深度融合。
硬件与算法协同发展,推动机器人具身感知系统,从简单感知功能,向复杂的智能认知转变,不仅提升机器人在复杂环境下适应性与可靠性,还拓展在更多领域应用场景,为机器人技术持续发展打下坚实基础。
当前机器人具身感知算法领域,尚未形成统一技术标准,头部公司与研究机构基于自身技术积累与应用场景需求,形成差异化解决方案。
机器人多模态感知技术,呈现百花齐放格局,核心算法主要围绕强化学习RL、视觉语言模型VLM、视觉语言动作模型VLA、端到端架构、多传感器融合算法、仿真训练等展开,世界模型等是前沿方向。
视觉语言模型VLM、视觉语言动作模型VLA,推动机器人突破场景理解技术天花板。
理想发布下一代自动驾驶架构MindVLA,迈向自动驾驶物理智能体关键一步。MindVLA是通用框架,不仅用于自动驾驶,也适用其他物理智能体。理想内部评价MindVLA,将类似Deepseek给其他AI应用带来变化,赋能其他现实世界物理智能体。
2025年3月18日,英伟达GTC 2025上,理想发布下一代自动驾驶架构MindVLA最新思考与进展。MindVLA是视觉-语言-行为大模型,理想内部称为机器人大模型,将空间智能、语言智能、行为智能统一,让自动驾驶拥有感知、思考、适应环境能力,是通往L4路上最重要一步。
MindVLA能为自动驾驶赋予类似人类的驾驶能力,将汽车变为能够思考的智能体,实现听得懂、看得见、找得到。就像iPhone 4重新定义手机,MindVLA将重新定义自动驾驶。未来MindVLA跑通物理世界与数字世界结合范式后,将有望赋能更多行业。
理想创始人李想介绍,规则算法的能力是昆虫,端到端E2E是聪明的猴子,VLA机器人大模型具备人类理解物理世界的脑系统。通往全自动驾驶没有捷径,比LLM更难,这是理想要做预训练与基座模型,要把空间、语言、行为的Token统一在一个基座中训练的原因。
相关研报:
国家经济、投资的范式变化:从碳基经济到硅基经济,AI寒武纪大爆发时刻
【智能时代】现象级游戏《黑神话:悟空》的思考,游戏二元属性,文化与科技
【智能时代】自动驾驶:汽车iPhone时刻,中国三大流派演化形成中
诸神之战:美国科技巨头,从春秋五霸进入战国七雄|GBAT 2023 大湾区智能时代产业峰会
人类未来文明三部曲之二:智能时代专题预售开启,奇点临近,未来已来
九宇资本赵宇杰:智能时代思考,认知思维,存在原生、降维、升维三波认知红利
九宇资本赵宇杰:智能时代思考,以史为鉴,科技浪潮,从互联网到AI
九宇资本赵宇杰:智能时代思考,宇宙视角,从碳基生物,到硅基智能体
人类未来文明三部曲之一:元宇宙专题预售开启,59期45万字
九宇资本赵宇杰:1.5万字头号玩家年度思考集,科技创新,无尽前沿
九宇资本赵宇杰:1.5万字智能电动汽车年度思考集,软件定义,重塑一切
【重磅】前沿周报:拥抱科技,洞见未来,70期合集打包送上
【重磅】六合年度报告全库会员正式上线,5年多研究成果系统性交付
【智能电动汽车专题预售】百年汽车产业加速变革,智能电动汽车时代大幕开启
【头号玩家第一季预售】:科技巨头探索未来,头号玩家梯队式崛起
【头号玩家第二季预售】:科技创新带来范式转换,拓展无尽新边疆
【首份付费报告+年度会员】直播电商14万字深度报告:万亿级GMV风口下,巨头混战与合纵连横
【重磅】科技体育系列报告合集上线,“科技+体育”深度融合,全方位变革体育运动
【重磅】365家明星公司,近600篇报告,六合君4年多研究成果全景呈现
九宇资本赵宇杰:CES见闻录,开个脑洞,超级科技巨头将接管一切
【万字长文】九宇资本赵宇杰:5G开启新周期,进入在线世界的大航海时代|GBAT 2019 大湾区5G峰会
九宇资本赵宇杰:抓住电子烟这一巨大的趋势红利,抓住产业变革中的变与不变
【IPO观察】第一季:中芯国际、寒武纪、思摩尔、泡泡玛特、安克创新等11家深度研报合集
【IPO观察】第二季:理想、小鹏、贝壳、蚂蚁、Snowflake、Palantir等12家公司深度研报合集
【IPO观察】第三季:Coinbase、Roblox、快手、雾芯科技等12家公司深度研报合集
【重磅】年度观察2019系列合集:历时3个多月,超20万字近500页,复盘过去,展望未来,洞悉变与不变
【珍藏版】六合宝典:300家明星公司全景扫描,历时3年,210万字超5,000页,重磅推荐
九宇资本赵宇杰:对智能电动汽车产业的碎片化思考
九宇资本赵宇杰:九宫格分析法,语数外教育培训领域的道与术
【2023回乡见闻录】90、00后小伙伴们万字记录,生活回归正轨,春节年味更浓
【2022回乡见闻录】20位90、00后2万字,4国13地,全方位展现国内外疫情防疫、春节氛围、发展现状差异
【2021回乡见闻录】22位90后2万字,就地过年与返乡过年碰撞,展现真实、立体、变革的中国
【2020回乡见闻录】20位90后2万字,特殊的春节,时代的集体记忆
【重磅】22位“90后”2万字回乡见闻录,讲述他们眼中的中国县城、乡镇、农村
六合君3周岁生日,TOP 60篇经典研报重磅推荐
下午茶,互联网世界的三国杀
5G助推AR开启新产业周期,AR眼镜开启专用AR终端时代
新商业基础设施持续丰富完善,赋能新品牌、新模式、新产品崛起,打造新型多元生活方式
【重磅】中国新经济龙头,赴港赴美上市报告合辑20篇
知识服务+付费+音频,开启内容生产新的产业级机遇,知识经济10年千亿级市场规模可期
从APP Store畅销榜4年更替,看内容付费崛起
新三板破万思考:新三板日交易量10年100倍?
九宇资本赵宇杰:科技改变消费,让生活更美好|2017 GNEC 新经济新消费峰会
九宇资本赵宇杰:创业时代的时间法则,开发用户平行时间|2016 GNEC 新经济新智能峰会
请务必阅读免责声明与风险提示
来源:六合商业研选