摘要:虽然好莱坞还挺喜欢Elektro的——它客串了不少电影,多少也启发了C-3PO的造型——但在市场噱头幻灭之后,Elektro还是被扔进了报废仓库,成为历史长河里数不清的过客之一。
文 | 阑夕
1939年,一台会说话的机器人,震惊了造访纽约世博会的每一个游客。
机器人名叫Elektro,造型酷似「绿野仙踪」里的铁皮人,不过覆满全身的是铝板,且被涂成了古铜色,它由西屋电气生产,在设计上带有典型的工程师风格。
在展台上,Elektro口齿清晰的发表自我介绍:「女士们,先生们,我很荣幸见到各位,我是一个聪明的家伙,因为我的大脑里有48个继电器。」
Elektro甚至能够表现出幽默感,当有游客停下来打量它时,它就会冷不防的来上一句:「我的大脑比你大」。
这也是实话,因为那48个继电器加起来重达25公斤,远非人类可以比拟。
兴奋的媒体很快就把Elektro当成未来已至的造物,用尽一切溢美之词赞美这个时代的科技奇观,但不出意外的,意外还是虽迟必到。
西屋电气很快承认,Elektro其实并不是真的会说话,所有的语音指令,都是提前录制好的,由操作员控制播放,那些充满机锋的对话,也只是经过编排的剧本。
虽然好莱坞还挺喜欢Elektro的——它客串了不少电影,多少也启发了C-3PO的造型——但在市场噱头幻灭之后,Elektro还是被扔进了报废仓库,成为历史长河里数不清的过客之一。
不过人类还是不曾放弃创造智能物种的念想,近一个世纪以来,人工智能的探索曲折蜿蜒,终于在这几年的大模型浪潮里,第一次接近了为无机物赋予生命并和「它们」平等对话的可能。
而看着哆啦A梦长大的一代人,也开始有机会制造下一代人的哆啦A梦了。
2024年的最后一个月,火山引擎在上海举办了Force原动力大会,AI继续担当主角并不让人感到意外,但AI落地到硬件的场景崭露头角,还是有些科幻走进现实的味道。
想象一下,未来的潮玩和手办,将不再只能放在展示柜里观赏,而是每一个都内置「人格」,可以随时响应用户的召唤,和他们对答如流的畅谈诗与远方,这会带来怎样颠覆性的产业变革?
越来越聪明的大模型看上去已经能够胜任这样的角色了,但真实的工业生产,从来不是把软件装在硬件里,就能解决一切需要,在火山引擎参与「组局」之前,对话式AI+硬件最大的问题其实在于——AI感的无法消除。
在日常的使用场景里,普通人大概体会不到主流智能手机的计算性能和操作系统有多强大,然而一旦将同样的大模型置于千元以内的硬件终端里,那种交互上的违和感很快就会出现。
比如反应变慢,一句话问完要等好几秒后才有回应,或是无法像自然对话那样随时打断,往往用户插嘴后AI还在滔滔不绝的输出既有内容,再就是对弱网场景支持不足,在接收指令时丢失了关键信息,以致于已读乱回的情况时常发生。
加上在多模态的环境里,人与AI之间的交互,不仅有低带宽的文本和语音,还会包含高带宽的视觉影像,以及情绪模拟的个性化适配,这就更加考验端侧音视频处理的能力了。
理解了将AI和硬件组合在一起的难度,也就理解了为什么火山引擎要来推出解决方案,就商业逻辑而言,让硬件公司专注于消费制造,让软件平台专注于模型开发,是效率最高的最优解,而中间的粘合环节,恰好就是火山引擎的擅长领域。
毕竟,在实时音视频RTC配合AI接入的这条技术线上,火山引擎可能是云计算厂商里,走得最远的那一家。
火山引擎对于RTC技术的长期投入,让它同样成为对话式AI的方案供应商,昔年的深耕穿越至今结出硕果,倒是有些「养兵千日,用兵一时」的意思。
世界杯的多人观赛、抖音的直播连麦、飞书的多人会议……从规模负载来看,火山引擎RTC的实战积累,也是全球领先的,所以当AI交互的新场景出现后,火山引擎并不需要重新造轮子,而是可以直接站在先进经验的山头,另起青云。
于是,不到半年时间,火山引擎就从发布实时对话式AI方案、向着行业喊话的试探性角色,上升到了联合IoT领域的国产龙头乐鑫科技正式支持硬件制造商们入局的核心圈玩家,同时火山引擎也和这几家厂商联合发布「硬件+对话式AI」智跃计划。
乐鑫科技是做IoT芯片的,全球出货量累计超过了10亿颗,是这个细分市场的头部公司,在大会专场上做了30分钟的演讲。
其中有一个比喻非常通俗:在这一轮AI潮玩造物的产业分工里,硬件生产商,相当于是在制造「肉体」,乐鑫这类集成电路设计企业,负责构建「大脑和神经」,而接进来的各种大模型,则承担着赋予「灵魂」的使命。
以此类推,火山引擎作为云服务平台的价值,就是为上述器官提供一套「生命系统」,从消化到代谢,从呼吸到知觉,确保智能的平稳运行。
具体来说,乐鑫专为AIoT市场供应的的ESP32-S3芯片,将会集成火山引擎的RTC能力,内置一套「即插即用」的大模型语音交互模组,把端到端的响应延迟压到可在1s以内,还能灵敏识别用户的打断意图,还原人机(大模型)之间的真人感对话。
直接调用豆包大模型后,还能获得最新的多模态交互技术,让潮玩等AI硬件可以「看到」甚至「察觉」用户的情绪,可以持续与AI持续对话,不用「一按一问」。
随着前沿技术的溢出,硬件消费品可能到了最合适的下场时机,互联网产业上游都在致力于提供一站式保姆服务,万事俱备,只欠产品。
加入这场「硬件+对话式AI」盛宴的潮玩品牌ToyCity,是一家典型的制造业厂商,前身曾是东莞数千家玩具代工厂里的一员,为高达、米老鼠、变形金刚等一线玩具品牌生产组件。
2020年,创始人郑波决定开创自己的设计师玩具品牌,这也是过去十几年来并不少见的,从中国制造到中国智造的产业升级叙事。
在分享环节,郑波拿出了ToyCity旗下最成功的原创IP「耙老师」,认为这只在潮玩圈里家喻户晓的熊猫非常适合成为公司史上第一代AI潮玩的形象,可爱无害,柔软可捏,情绪价值拉满。
在郑波看来,他看好AI潮玩迎来普及化的机会,是基于专业,而这里的专业,指的不只是ToyCity的设计能力,还包括专业的芯片、模型和对话技术,一切的水到渠成,都取决于各方都把自己的专业打磨到了可以直面市场的程度。
和ToyCity一起「入伙」的,还有新兴的潮玩品牌FoloToy,曾以对儿童玩具火火兔的AI化改造一夜成名,以及面向年轻女性市场的珞博智能、为普通人打造赛博伙伴的魂伴科技,它们的共同点在于,相信潮玩的陪伴价值,会在原子化的未来社会里被无限放大。
比如要想实现魂伴科技的愿景,就对交互技术有着极高要求,AI不应该止步于有问必答的工具人,更应该充当打破次元壁的个人CP,它甚至可以笨一点,需要人的关怀和陪伴,双向输出情绪价值,让AI和人性一起成长。
在魂伴科技的使命里,「复活」人们耳熟能详的那些经典IP,是最有价值的链条所在,让分院帽、宝可梦、红小豆这些可被抱在怀里的柔软玩具,成为像影视剧里表现出来的,可以不分昼夜的陪在用户身边,随时回应情感需求,在这样的时刻,市场对于玩具的估值和期待,将得到彻底改写。
为了证明自身的存在不是孤独的,人类可以制作出经过10亿年都不会腐朽的金唱片,让旅行者号探测器带着它飞向宇宙深空,而在不需要远离地球的另一条技术线上,以造物主的身份创造出数字化的同类,也能抵达同样的终岸。
而且,这也不是局部的认知,而是全球的共识。
今年8月,OpenAI投资了一家不起眼的初创公司Heeyo,其产品就是利用大模型打造儿童的数字玩伴,由哈佛和斯坦福的心理学家参与设计,可以提供早期教育的定制化服务。
即使是在「少子化」的日本,玩具市场在过去一年的增长,依然保持在7.1%的高位,无论是儿童还是成人,都在对抗孤独这件事情上,有着强烈的需求意志。
玩具的AI化,是在功能性和娱乐性的基础上,把那些「无用之物」变成了赛博时代的生命体,并将另一个数量级的陪伴市场嫁接过来,虽然很难估量交叉之后的产值,但让从业者燃起兴奋,是毋庸置疑的。
就像Google Pixel的存在意义是给各家Android手机厂商「打样」,火山引擎今年中秋定制的毛绒玩具「显眼包」,也给AI+硬件这条赛道,做了一次很有意思的启蒙示范。
在二手平台,「显眼包」的交易价格已经上涨到了300-500块钱不等,这个萌翻众人的火山拟人玩偶,以其「体形虽小,智慧俱全」的对话体验,在没有量产计划的情况下,依然火出圈了。
或者说,卷模型的事情,就交给大厂们去砸钱,站在制造业大国的路径上,高度成熟的供应链资源,是不应该被浪费的,最难的技术链打通之后,压力就来到了最需要创意和情感的消费级市场。
根据第三方招聘平台的数据,AI的大浪袭来,再度复兴了产品经理这个古典职业,在国内新经济行业今年的新发岗位数量上排名第一,新闻里的AI隔三差五就出王炸,普通人的感知却长期偏弱,中间横亘的深邃鸿沟,需要更多的大众向产品来填平。
不只是玩具,在广义的AIoT市场里,万物的感知系统一定会越来越强,未来所有的生活场景都离不开软件,而软件则生长在云设施上,从支持人和物的对话开始,火山引擎的历史使命,也是从万物的IT化,到万物的AI化。
俄亥俄州的曼斯菲尔德纪念馆后来收藏了Elektro的遗骸,配上的文字充满深意:「每天都有改变历史的发明被扔进垃圾桶里。」
而在今天,所有投身AI赛道的建造者,都有机会亲手把科幻电影里的未来实现在近在咫尺的前方,怎么看,这都是一件高燃的事情。
来源:阑夕一点号