摘要:本硕就读于西安交通大学,后于日本京都大学攻读博士,专攻系统设计与机器人方向。先后就职于松下、京东、华为,安克创新等公司,主导了多款智能硬件产品的研发项目。
魏强简介 / 智元机器人灵犀业务线总裁:
本硕就读于西安交通大学,后于日本京都大学攻读博士,专攻系统设计与机器人方向。先后就职于松下、京东、华为,安克创新等公司,主导了多款智能硬件产品的研发项目。
“我们曾遇到一位客户,那是一家自闭症儿童的康复中心。在和这里的孩子们交流时,他们的问题出乎产品经理的意料。例如他们觉得灵犀X2怎么没有更可爱的名字?年龄多大?对什么感兴趣?”
魏强说,这给了他们启发——灵犀的潜在用户中,可能更希望一个有鲜活形象、自我认知、自己性格的产品。
于是,近日开启合作伙伴招募的灵犀X2,主打的特点之一就是「生物感和温暖感」。它不仅拥有了「硅基少年」的称号,甚至还被内置了ENFP的外向性格。
“硅基少年指的是形态:灵犀X2的身高为1.3米左右,相当于15岁左右的少年。但其实它的大脑能力是远超这一年龄段的。”魏强说道。
三个版本的区别
据介绍,灵犀X2集运动、交互、作业能力于一体,可应用于文娱表演、展厅讲解、科研教育、康养陪伴等场景。
魏强表示,灵犀X2的价格范围在十几万到三四十万元不等,具体要参考场景需求和选装的配置。
此次招募合作伙伴销售的灵犀X2机器人分为三个版本:
在X2(交互版)「拟人步态、语音对话、触摸反馈、情绪表达、灵动动作」的基础上,X2 Pro(探索版)及X2 Ultra(旗舰版)新增了更加丰富的交互、作业原子能力开发接口,提供自主导航功能的选配。
X2 Ultra(旗舰版)可进阶选配自适应夹爪OmniPicker、末端灵巧手OmniHand、超视距遥操和动捕动作录入功能。
魏强补充介绍称,X2交互版不提供二次开发的能力,主要场景是展厅讲解、文娱展演;
而X2探索版提供二次开发的接口,可以选配各种自由度,感知交互头也可以自由选配,比较适合于科研教育领域;
X2旗舰版则相当于「功能全集」,具备灵巧手、夹爪作业能力,可用于科研教育的,论文研究,或者要求更高的公园、场馆场景。
同时,旗舰版的软件功能配置也比较丰富,例如自主导航、多模态交互的功能,都是以软件包的形式给到用户。
架构设计思路
“在设计系统架构的时候,我们不想把端侧做得太重。于是选择用一个RK芯片来进行一些运控,还有简单视觉。而大语言模型和全量语音识别,都是放在云端做的。”
魏强表示,为了给用户更多选择,灵犀X2也提供英伟达Orin的高算力平台,可用于室内外导航。
“有的用户只想做自己的功能和算法,不想为此再外挂一个板子或者芯片,他们想拿到之后就直接开发算法,所以我们提供了这样的配置。”
同时,灵犀X2也可以只提供本体和二次开发接口,供用户接入其他的软硬件平台。
灵犀X2的三大特点
目前,智元机器人的业务线包括:
1、远征系列:以远征A2为例,它是一台高1.7米的全尺寸机器人,有40多个自由度,主要用于工厂作业;
2、灵犀系列:以X2半尺寸机器人为例,它同时具有自动运控、多模交互和具身操作的能力。同时该系列会在Q2发布一款四足机器人产品,内部名称为灵犀D1,主要面向教育场景和家庭开发场景,提供本体运动能力和开发平台。
3、精灵系列:轮式+双臂的机器人产品。
而灵犀X2的三个特点,就是灵动、亲和,智能。
魏强称,灵动表现在其全身的自由度——除了腿部和手臂外,其腰部也设置了三个自由度,头部有两个,手部除了能进行复杂的舞蹈表演外,还可以进行抓取或是一些简单作业。
亲和主要表现在交互层面:X2通过视觉交互、语音交互、触觉交互外,还能通过头部显示屏显示表情。
“我们通过语言、视觉甚至触摸,以及空间物理位置系统,构成一种复杂的基于物理世界场景的交互,这样也可以获取更多交互数据,来不断提升硅光动语大模型的能力。”
至于智能程度,主要表现在室内外相对确定的环境下进行自主导航、避障的能力。用户可以选配自主导航功能包,彻底抛开摇控器,独立进行工作。
场景的需求及发展
“灵犀X2是灵动的,有生命力的。它可以坐在椅子上面自己甩甩腿,也可以自主地走到某一朵花前边驻足欣赏,完全像一个生物一样。”魏强指出,这是X2最主要的特点。
除了教育领域,文娱场景,它另一个关键场景是展厅讲解:“现在我们已经开始和中国移动进行合作,在展厅中开展了讲解服务。”
他表示,虽然X2还在开发过程中,但已经有很多客户产生了意向,希望在公园里面做一些展演,而且需求量还是不小的,预计今年下半年的量会逐渐增多。
至于后续的场景拓展,养老是依然是一个重要方向。
“康养陪伴刚开始不是直接走入家庭的,而是在养老社区的环境中。比如说送水、拿药,提醒吃药等服务。不过,未来终有一天,机器人能够走到家庭里面,真正起到家庭里面当保姆、保洁、保安,三保服务的功能。”
人形机器人的瓶颈
魏强认为,机器人最需要的还是泛化能力。首先,在硬件层面,关节电机的灵活度需要不断提升。
他介绍称,从人形机器人整本构成来说,最重要的就是关节链接模组,再就是各种控制域的控制芯片。
“现在关节电机的灵活度,虽然和两三年前有很大提升,能够做到几厘米之内精巧的动作,但和人体相比还有很大提升空间。”他指出,当下关键模组的重量、寿命、散热、功耗和效率其实都还有待进步。
同时,相对于手机有专门用的芯片SOC,人形机器人的SOC和整体硬件方案都还在发展过程中。
另外,在交互能力上,机器人对复杂场景的理解和判断能力同样还有上升空间,也就是在模型端还需要有更高维度的进阶。
“人形机器人的多模态交互,不仅仅包括语音和视频,还包括数据、触觉、动作,以及各种各样的传感器。所有的传感器的输入如何能够让模型有正确的理解,然后将正确的反馈直接映射到所有的电机、传感器的输出上,这个其实也还在发展过程中,还有很大的发展空间。”
何时才能降本?
“我觉得技术突破和成本控制之间没有必然联系,算力现在也并不是构成现在技术卡点的关键因素。”
魏强认为,从成本来看,「量」是很关键的因素。如果有足够大的规模,整个产业链是可以针对需求来不断优化的,成本肯定会不断下降。
“但是,目前的人形机器人的还处于量产的初期阶段。这不是靠一两家企业,而是要靠整个产业链。包括关节、电机,还有结构模组、芯片、灵巧手,材料等等,都需要一同实现高品质规模化,才能实现整体成本进行降低。”
市场形态及变化
今年,机器人租赁市场快速膨胀,但魏强觉得这只是一个短期现象。
“我觉得这不一定是健康的模式,它需要回归到一个比较理性或者有迭代的模式下才有价值。过去几个月,大家做出的都是同样的东西,拿着摇控器做一做,同质化太严重了。例如在文艺场景中,基本上都是遥控一下,挥挥手,这甚至第一步都不算。我们这次这些产品,除了基本运控可以挥手、坐下起来、跳舞还有交互功能。”
至于海外市场,魏强表示,现在智元所有的产品都是针对全球市场来进行设计的。智元会将产品直接销到海外,然后通过当地合作伙伴的渠道、服务能力,将产品送到用户手里面。
“目前看,海外比较旺盛,尤其是在科研教育领域,这基于大家对这一新技术发展时间点的认知。”
来源:RoboX