摘要:今年春节,你收到的红包可能来自AI。11月29日,大模型初创企业智谱在其技术开放日上发布了其智能体(agent)上的新进展。在现场,智谱CEO张鹏对着智谱旗下智能体AutoGLM发出一句话发红包的指令,AutoGLM快速向人类发出了首个红包。
今年春节,你收到的红包可能来自AI。11月29日,大模型初创企业智谱在其技术开放日上发布了其智能体(agent)上的新进展。在现场,智谱CEO张鹏对着智谱旗下智能体AutoGLM发出一句话发红包的指令,AutoGLM快速向人类发出了首个红包。
作为GenAI(生成式人工智能)的执行者,Agent能够根据AI提供的算法和逻辑,与外部环境交互,执行任务,并给出反馈。Agent是目标驱动型的,能够完全执行工作流程,适应、学习、迭代、与其他系统和人类协作,并端到端地完成任务。南都记者关注到,在现场演示中,AutoGLM目前已可完成超长任务、跨App的任务和短口令任务,除了能一句话发红包,还给某个群里所有人的首条朋友圈点赞。
能发红包、跨App比价的智能体
早在今年10月,智谱就推出了其智能体AutoGLM。当时AutoGLM能模拟用户的屏幕操作,如点击手机应用等。升级后的AutoGLM可实现更多样的功能,张鹏现场介绍称,新升级的 AutoGLM可以挑战完成包括超长任务、跨app比价、短口令等。在超长任务方面,例如,在采购火锅食材的例子中,AutoGLM能自主执行了54步无打断操作。据悉在这种多步、循环任务中,AutoGLM的速度表现超过人手动操作;在跨app操作方面,AutoGLM支持用户用AI跨App执行任务;在短口令方面,AutoGLM能够支持长任务的自定义短语。
另外,AutoGLM甚至还推出了“随便模式”,在该模式下AutoGLM能主动为用户做出决策,例如让AutoGLM能随机决策为用户点咖啡。目前AutoGLM已启动大规模内测,并将尽快上线成为面向 C 端用户的产品。
Web端也开启了“全自动”上网新体验。目前智谱清言插件也已上线AutoGLM功能,支持搜索、微博、知乎、Github 等数十个网站的“无人驾驶”。在现场演示中,智谱清言插件自动完成了“搜索芒果tv,打开《小巷人家》,播放最新一集,发弹幕结局打卡”,全程没有人为干预。在现场,张鹏智谱AutoGLM发出一句话发红包的指令,AutoGLM快速在微信群聊中向人类发出了总价两万的红包,随后张鹏还让AutoGLM在支付宝口令中发出了红包。
在手机和浏览器以外,智谱还发布了基于PC的自主Agent。GLM-PC是GLM团队面向PC实现“无人驾驶”的一次技术探索,目前已开放以下六个场景:包括帮用户预订会议和发送会议总结的“会议替身”场景,支持文档下载、发送、理解与总结的文档处理场景,在微信公众号、知乎、小红书等平台搜索关键词完成阅读与总结场景,设定一个未来时间并定时执行任务场景以及在用户工作时在屏幕上“隐形”完成工作的场景。
张鹏在现场透露,从23年4月的AgentBench开始,到8月的CogAgent模型,智谱针对AutoGLM,和GLM-PC的模型CogAgent的研发工作进行了一年半的时间。
AI巨头将智能体作为2025年主要关注点
著名咨询公司Gartner近期将agentic AI列为2025年十大技术趋势之一,并预测2028年至少有15%的日常工作决策将由agentic AI自主完成,而这一数字在2024年为0。这意味着,一个关于agent的布局窗口期正在出现。
在国外,苹果(Apple Intelligence)、Anthropic(Computer Use)、谷歌(Jarvis)和 OpenAI(Operator)等企业也已经把agent作为2025年的主要关注点。国内,百度、字节、腾讯、阿里都已在布局agent。近期,百度CEO李彦宏在百度世界2024上提出,agent是AI应用的最主流形态,即将迎来爆发点。
在现场,智谱定义了大模型发展的五个阶段:在L1语言能力阶段,AI学会思考语言并能在大多数自然语言任务上突破图灵测试;L2逻辑能力(多模态能力)阶段,AI学会求解问题,涌现世界知识和类人的复杂逻辑推理能力,在问题求解方面突破图灵测试;L3使用工具的能力阶段,AI学会使用工具,利用工具完成多数人类物理世界问题,在工具使用方面突破图灵测试;L4自我学习能力阶段,AI通过自我学习能具备自我批判、自我改进以及自我反思能力;L5探究科学规律阶段,AI能力全面超越人类,具备探究科学规律、世界起源等终极问题的能力。
张鹏表示,目前大模型已初步具备人类与现实物理世界互动的部分能力。而Agent将极大地提升L3使用工具能力,同时开启对L4自我学习能力的探索。
不过张鹏也强调称,Agent虽然已展现出比较大的进步,但与人类的表现相比Agent仍有较大差距。“目前我们人类毫不费力完成的一些操作如滚动、拖动、缩放等,对Agent来说也是极具挑战的。因此在L3阶段,智谱今天的理解也才走到30%。”张鹏补充道,尽管目前技术还比较初期,但 Agent未来应用已经展现出了强大的前景。目前的Agent能力更像是在用户和应用之间,增加一个智能的调度层,链接所有应用甚至是所有设备。这可以看做是大模型通用操作系统LM-OS的一种雏形。
南都记者关注到,在终端层面,智谱已经和手机厂商荣耀、PC厂商华硕实现深度合作,在 AIPC、智能助手Agent等领域有诸多成果。同时,智谱也与高通、英特尔等芯片厂商展开了密切协作。
采写:南都记者 林文琪
来源:南方都市报一点号