智能体大爆发还缺什么?

摘要:9月的外滩大会上,支付宝在旗下AI生活管家“支小宝”上线时,当场用AI点了一杯星巴克咖啡;10月,vivo推出手机智能体“PhoneGPT”,“能给用户买咖啡”成了代表用例;在几天后的荣耀Magic7手机发布会上,荣耀 CEO 赵明现场一句话让 YOYO 点了

最近科技圈流行用AI点咖啡。

9月的外滩大会上,支付宝在旗下AI生活管家“支小宝”上线时,当场用AI点了一杯星巴克咖啡;10月,vivo推出手机智能体“PhoneGPT”,“能给用户买咖啡”成了代表用例;在几天后的荣耀Magic7手机发布会上,荣耀 CEO 赵明现场一句话让 YOYO 点了2000杯瑞幸咖啡,附近多家门店爆单。

(图源:微博)

这一幕,让人想起了2007年iPhone面世的名场面:当时乔布斯拿着iPhone,给星巴克打了一个电话告诉店员要预定4000杯咖啡——不过,当时乔布斯只是开了一个玩笑。

(图源:YouTube)

17年互联网沧海桑田,从iPhone打电话预订咖啡,再到AI助理一句话点咖啡,正好是时代变迁的注脚:互联网的主线,已经从移动切换到AI。

AI重新定义软硬件,智能体大爆发

24年开年,OPPO拿下春晚黄金时段30秒,宣布Al战略。在接下来的一年,AI也成了硬件发布会上的最大公约数。国外,三星喊出“AI IN ALL”、苹果推出Apple Intelligence;国内,华米OV荣五大头部巨头,不约而同押注端侧智能。在手机外,联想、海信等硬件巨头分别沿着AI PC、AI电视等等AI硬件赛道进发。AI重新定义硬件的风潮,在CES、MWC、IFA三大世界科技展会上同样十分明晰,AI眼镜、AI耳机等AI硬件新物种呈现出爆发之势。

在终端与OS拥抱AI大模型的同时,百度、阿里、腾讯、字节、蚂蚁等互联网巨头同样将AI视作重头戏,智谱、月之暗面等AI大模型创业公司也推出了各自的AI应用,文小言、豆包、支小宝实现了用户规模上量。

不论硬件OS层的AI助理,还是互联网公司推出的AI应用,都有一个共同身份:智能体。24年,AI成功从AIGC(AI创作)类应用拓展到AI Agent(智能体)领域。相较于关注创作内容与提供信息的AIGC工具来说,智能体可感知环境和理解意图,拆分任务并完成各项事务,除了“点咖啡”,还可以“一句话”订票、订座、打车……在执行任务时,智能体会不断学习,更好地服务于人。

23年底,OpenAI推出GPTs和GPT商店,允许用户无需编码就可创建自己版本的GPT,从而构建一个智能体平台和生态,此后亲自推动PC与互联网革命的比尔·盖茨在其个人网站撰文指出,“智能体不仅会改变每个人与计算机交互的方式,还将颠覆软件行业,带来自我们从键入命令到点击图标以来最大的计算革命。

事实上,智能体这一概念正是比尔·盖茨在1995 年出版的《未来之路》一书中提出,“由于人工智能的进步,它们直到最近才变得实用。”在比尔·盖茨看来,智能体“几乎可以在任何活动和生活的所有领域提供帮助”,比如医疗保健、教育、娱乐购物、工作。

(图源:比尔·盖茨个人网站)

而用百度CEO李彦宏的话说,智能体就是AI时代的网站,“将会有几百万、甚至更大量的智能体出现,形成庞大生态。”来自QuestMobile的数据显示,截至9月,通义App内智能体数量超过1.6万个,讯飞星火智能体数量超过1.1万个,豆包内智能体数量超9000个。而据信通院泰尔终端实验室信息安全部副主任傅山介绍,据国内外主流智能体平台运行情况来看,平均每天有增加2-8万个智能体。

AI时代,智能体将扮演入口的角色,用户将通过独立的智能体,或者App内的智能体,获得内容、商品和服务,这是一个比App更加庞大的生态。不过,智能体当前正面临着一个严峻的问题:缺乏协作,这将是一个比移动互联网时代的“App孤岛”更严重的问题。

智能体各自为阵,跨智能体协作困难重重

当前,智能体与智能体之间没有联系,每个智能体负责各自任务,这让智能体的能力受到很大局限,也无法完成复杂任务,比如用户让生活助理智能体“安排一下去北京出差的行程”,理想的情况它能在结合用户偏好情况下,全平台比价订票、订酒店,再预约好网约车来接机,甚至查一下北京的天气给用户提供着装建议。由于需要用到N个智能体,现在的生活助理无法完成这样的任务。

智能体难以协作的根本原因在于技术掣肘。在 IIFAA互联网可信认证联盟技术负责人万小飞看来,当前智能体处在快速发展的早期,行业没有标准导致智能体协作至少面临着四重技术挑战:智能体的可信身份、数据的可信流通、业务的风险识别、以及确保智能体内部的主权神圣不可侵犯。

首先,智能体之间缺乏一套互连标准,难以协作。在《人工智能即将彻底改变你使用计算机的方式,并颠覆软件行业》一文中,比尔·盖茨也指出,“智能体当前最大技术挑战之一是不同智能体的交互,技术层面没有一个标准协议允许智能体相互通信,没有适合适合智能体的数据结构出现。”

其次,智能体协作时,面临巨大的隐私安全挑战。

智能体的互连协作,与用户隐私保护存在着直接矛盾。在Apple Intelligence发布后,马斯克立即发帖说,倘若苹果在操作系统层面集成OpenAI,他将禁止苹果设备进入自己旗下的公司,因为“苹果完全不清楚把数据交给OpenAI后会发生什么,他们这么做完全是在出卖用户。”

点对点的深度合作存在隐私安全挑战,规模化的智能体要常态化协作,挑战更大。在意图流转的同时,智能体之间要分享一些数据,比如旅行智能体可能要分享用户的身份信息、消费记录、习惯偏好,这些很可能是极度敏感的隐私数据。

比尔·盖茨也指出,智能体让在线隐私和安全问题将变得比现在更加紧迫,“你什么时候希望它们互相合作,你的智能体应该分享多少信息?谁拥有你与智能体共享的数据,以及如何确保这些数据得到适当使用?”

最后,智能体“各行其道”却没有红绿灯,存在巨大的安全风险。

人类在让智能体完成更多任务的同时,必须将更多权限给它,比如L5自动驾驶手机能自动点击App,做用户能做的一切事情,如果没有成熟的管控体系,安全风险十分巨大。美国加利福尼亚大学伯克利分校、加拿大蒙特利尔大学等机构专家近期在美国《科学》杂志发文称,“人类很难限制强大智能体对其环境施加影响”,例如,智能体可说服或付钱给不知情的人类参与者,让他们代表自己执行破坏行动,比如在社交网站上发布有偿招募令来引诱一个人参与现实中的敲诈案。

在智能体协作时,如何确保这一过程不被“坏人”钻空子?技术层面要确保意图理解到位、任务执行可控可监督,还要有类似于自动驾驶“司机强制接管”的兜底;制度层面,需要建立标准规范、协作制度,确保只有可信智能体才能参与协作,且全程安全可控。

如何解决智能体协作中的种种难题?日前,IIFAA成立“IIFAA智能体可信互连工作组”,为制定跨智能体交互的相关安全技术规范做一些积极的探索。

(IIFAA智能体可信互连工作组正式成立)

IIFAA智能体可信互连工作组,搭了一座桥

具体来说,IIFAA智能体可信互连工作组将以制定跨智能体交互的相关标准等方式,解决智能体协作互连的难题。据万小飞介绍,工作组的目标是确保智能体和智能体之间能有一套相互的协同和通信的机制,第一阶段工作主要聚焦在如下4个维度:

1、智能体可信身份鉴权。“APP都有身份鉴权体系,智能体没有,它的身份到底是属于APP还是设备?要去做一些相关的定义”;

2、数据的可信流通问题。当智能体孤岛打破后,两个智能体之间,数据的隐私保护职责方到底是谁?数据的所有权到底属于谁,需要定义,要确保数据在端上有一个可信流通通道和机制;

3、业务的系统风控问题。A智能体在按照B智能体分发的意图做任务时要“听命于”B,因此必须要建立跨APP防护体系,避免智能体被恶意意图操控,出现类似自杀、欺诈、黄赌毒等情况。

4、智能体的主权保护问题。“要在技术维度保证各个智能体内部的主权神圣不可侵犯,一定做到无法被侵入到系统内部调我服务。”

回到前面提到的我要求个人智能体“安排一下去北京出差的行程”的案例。有了可信互连机制后,我的个人智能体就可以将我的身份信息在脱敏匿名后,分发给旅行智能体去订票订酒店,分发给出行智能体去订车,整个过程只有拥有“可信身份鉴权”的智能体才能参与协作(类似App经过AppStore审核成为“合法”应用一样),如果我的个人智能体要求旅行智能体借贷款、买会员,对应智能体将拒绝执行,如果出现未成年人坐飞机这样的情况,旅行智能体还会按照法律法规要求“上游智能体”提供相关家长证明资料。

也就是说,IIFAA智能体可信互连工作组要做的就是建设智能体可信互连行业规范,确保智能体身份可信、服务调用可信、数据流转可信,在确保智能体可以高效、流畅、深度协作的同时,保护用户隐私与权益,遵循社会法律法规等治理要求。

智能体第三方标准这事儿,必须要有人来做

智能体产业要健康、繁荣,必须要有互联协作标准,这件事也必须由第三方来做。

类比互联网发展来看,IIFAA智能体可信互连工作组做的事情,跟互联网发展中的万维网联盟(World Wide Web Consortium,简称 W3C)并无本质不同。

W3C创建于1994年,是Web技术领域具有权威和影响力的国际中立性技术标准机构,一共发布了400多项影响深远的Web技术标准及实施指南,如HTML、XML、CSS等等。作为互联网标准化基础设施,W3C如今已十分庞大,一共拥有44个标准工作组、9个兴趣小组、381个社区组,以及3个业务组。毫不夸张地说,W3C是互联网的一块基石。

(W3C万维网联盟)

IIFAA智能体可信互连工作组其实也是要构建类似于HTML这样的标准,给不同智能体互相协同和通信构建基础设施。

一方面,发起IIFAA智能体可信互连工作组的“IIFAA互联网可信认证联盟”有丰富的标准化经验,这一联盟成立于2015年,致力于可信身份认证等工作,拥有300多家成员单位,之前做的事情和智能体可信互连工作组有一些互通性。当年IIFAA推动指纹认证,人脸认证普及,推动行业建立了共同follow的安全协议标准,让手机上的指纹/人脸识别结果可以被银行App,12306、个税、支付宝等等认可。基于可信认证规范的经验积累,以及与国内外标准组织的联动机制,IIFAA可以快速启动智能体可信互连的相关工作。

另一方面,头部玩家的共识与支持,可形成头羊效应。IIFAA智能体可信互连工作组第一批成员包括中国信通院、荣耀、OPPO、小米、华为、智谱、字节、阿里、蚂蚁、京东、中国移动、高通等二十余家头部科技企业和单位,涵盖核心终端巨头、科技巨头、大模型头部公司、运营商、芯片等产业链上下游玩家。随着头部玩家拥抱智能体可信互连,后续软硬件玩家再加入就能“搭便车”,实现智能体可信互连,抓住AI的巨大红利。

在万小飞看来,不是每个企业或者开发者,都能像巨头一样“点对点”合作来实现智能体协同。“点对点”的合作很难规模化,且是“异构”的,可能只是在早期发展阶段适合大厂,但苹果不大可能与初创公司合作,因此要让终端侧智能体的协同同构化、规模化,必须要靠可信互连机制,“只要大家符合这个标准,不管你是谁,遵循这个标准,就可以接入互连的体系。”IIFAA智能体可信互连工作组建立的机制会更开放,更公平,给所有智能体提供快速发展的可能性,“ 我们希望建立一个比较普适,普惠的基础设施,能够让未来更多的人,更多的智能体快速做这种相关的链接”。

智能体的创新,一定要靠中长尾开发者,不能只靠巨头,就像移动互联网有几百万开发者、上千万应用一样;智能体产业的发展,一定要靠智能体之间的互相协作,只有海量智能体协作才能服务好人类。这样看,IIFAA智能体可信互连工作组的所有成员,一起给智能体产业发展搭了一座桥,让天堑变通途,将有望推动智能体更大的爆发。放眼看去,还有许多工作要做,我们乐见其成。

25年1月7日,CES(国际消费电子展) 2025 即将盛大开幕,雷科技报道团蓄势待发,即将飞赴美国·拉斯维加斯现场全程报道,敬请关注。

来源:雷科技

相关推荐