摘要:在AI领域迎来又一里程碑事件之际,智谱公司于3月31日正式揭晓了其最新研发成果——AutoGLM沉思智能体。这一创新智能体不仅深化了深度研究能力(Deep Research),更实现了从理论到实践的跨越,将AI Agent推进至“思考即行动”的新纪元。
在AI领域迎来又一里程碑事件之际,智谱公司于3月31日正式揭晓了其最新研发成果——AutoGLM沉思智能体。这一创新智能体不仅深化了深度研究能力(Deep Research),更实现了从理论到实践的跨越,将AI Agent推进至“思考即行动”的新纪元。
据智谱公司介绍,AutoGLM沉思的技术演进历经多个关键阶段,从GLM-4基座模型出发,经由GLM-Z1推理模型,进化至GLM-Z1-Rumination沉思模型,最终成就了AutoGLM模型。其中,核心链路的技术与模型将于4月14日全面开源,标志着智谱在AI Agent技术上的又一重大开放举措。
回顾智谱在AI Agent领域的探索历程,从2023年10月推出具备函数调用能力的智谱清言,到2024年1月上线支持智能体编排的GLMs,再到同年10月推出设备操控智能体AutoGLM,每一步都见证了智谱的创新与突破。此次发布的AutoGLM沉思模型,集深度研究与实际操作能力于一身,是自主智能体技术的重要里程碑,也是设备操控智能体的全新升级。
AutoGLM沉思的核心竞争力在于三大关键特性:深度思考、感知世界与工具使用。它不仅能模拟人类在面对复杂问题时的推理与决策过程,还能像人一样获取并理解环境信息,更具备调用和操作工具以完成复杂任务的能力。与OpenAI的Deep Research相比,AutoGLM沉思不仅擅长深入研究,更能付诸实践,从单纯的思考者转变为能产出实际成果的智能执行者。
AutoGLM沉思背后的模型,是智谱全新研发的Agent大脑——沉思模型。通过强化学习,该模型学会了自我批评、反思乃至沉思,以更长的深度思考时间换取更优的效果。这一突破性的技术实现了实时联网搜索、动态工具调用、深度分析和自我验证,推动了AI Agent在长程推理和任务执行方面的飞跃。
目前,AutoGLM沉思已在智谱清言的PC客户端上线,用户可免费体验其强大的研究能力和操作能力。此次发布的preview版本主要支持研究场景,未来两周内,智谱将进一步扩展智能体的执行能力,包括推出“虚拟机”版本,以增强AI Agent的实际应用潜力。同时,沉思功能也已在智谱清言的网页端、PC端和手机App正式上线,免费向公众开放,成为国内首个正式开放的Deep Research功能。
AutoGLM沉思的成功,得益于智谱自主研发的全栈大模型技术,该技术融合了GLM-4的通用能力、GLM-Z1的反思能力、GLM-Z1-Rumination的沉思能力以及AutoGLM的自动执行能力。其中,新版基座模型GLM-4-Air-0414以320亿参数量比肩国内外主流大模型,大大加强了工具调用、联网搜索和代码等智能体任务上的能力。新版推理模型GLM-Z1-Air在性能上可与DeepSeek-R1媲美,且在推理速度上提升了8倍,成本降低至1/30,进一步解放了开发者在硬件方面的限制。
在斯坦福大模型中心选定的智能体基准评测AgentBench上,AutoGLM系列模型在多个测试环境中取得了SOTA成绩,展现了其卓越的性能。特别是在Phone Use和Browser Use基准测试中,AutoGLM-Phone和AutoGLM-Web均超越了OpenAI GPT-4o和Anthropic Claude-3.5-Sonnet等竞品,彰显了智谱在GUI智能体领域的领先地位。
展望未来,智谱将继续聚焦Agentic GLM的研发,以推动智能体技术的快速发展。在技术层面,智谱将依托原创自主大模型技术,持续推动具备逻辑推理和深度思考能力的Agent基座模型与通用基座模型的研发,构建智能体框架与应用,朝着让机器像人一样思考和行动的目标迈进。同时,智谱还将搭建Agentic LLM平台,助力生态合作伙伴构建行业、地域与场景深度融合的智能体应用,共同推进AI技术的创新与应用。
来源:ITBear科技资讯