智谱AutoGLM沉思：AI新突破，深度研究与执行一体，性能直追DeepSeek-R1

摘要：在科技界的一次重大突破中，中关村论坛上亮相了一款名为AutoGLM沉思的创新AI产品，该产品由智谱公司推出，标志着全球首个集深度研究与实际操作能力于一体的智能体（Agent）的诞生。

在科技界的一次重大突破中，中关村论坛上亮相了一款名为AutoGLM沉思的创新AI产品，该产品由智谱公司推出，标志着全球首个集深度研究与实际操作能力于一体的智能体（Agent）的诞生。

AutoGLM沉思通过一系列技术创新，成功打破了实时联网搜索、动态工具调用、深度分析及自我验证的界限，实现了长程推理和任务执行的无缝衔接。这一成就不仅在国内首次正式开放了Deep Research功能，更将AI技术的应用推向了新的高度。

据智谱内部评估，AutoGLM沉思背后的核心——深度思考模型GLM-Z1-Air，在性能上已能与业界领先的DeepSeek-R1（671B，激活37B）相媲美。目前，该功能已在智谱清言的网页端、PC端及手机App上全面上线，且对用户免费开放，不限量使用。

AutoGLM沉思的发布版本为preview版，主要面向研究场景，而智谱计划在未来两周内进一步扩展其智能体执行能力，并推出“虚拟机”版本。技术演进路径涵盖了从GLM-4基座模型，经由GLM-Z1推理模型，到GLM-Z1-Rumination沉思模型，最终进化为AutoGLM模型的全过程。其中，核心链路的模型和技术将于4月14日正式开源，并陆续在MaaS平台上线。

AutoGLM沉思的设计初衷是让机器不仅具备思考能力，还能主动行动，实现“边想边干”。这一能力的实现依托于三大关键特性：深度思考、感知世界以及工具使用。AutoGLM沉思融合了这些能力，超越了OpenAI的Deep Research，不仅擅长深入研究，更能真正执行任务，使AI Agent从单纯的思考者进化为能够交付结果的智能执行者。

在技术细节上，智谱重新训练了320亿参数的基座模型GLM-4-Air-0414，通过加入更多代码类、推理类数据，并针对智能体能力进行优化，显著提升了模型在工具调用、联网搜索及代码任务上的表现。GLM-4-Air-0414以较小的参数量实现了与更大规模模型的比肩效果，特别适用于涉及多轮复杂交互的智能体任务。

基于GLM-4-Air-0414，智谱推出了全新的深度思考模型GLM-Z1-Air，通过引入更多推理类数据并在对齐阶段深度优化通用能力，使其在性能上与DeepSeek-R1相媲美，且在推理速度上提升了8倍，成本降低至1/30。GLM-Z1-Air还能在消费级显卡上运行，进一步降低了使用门槛。

智谱通过扩展强化学习训练，提升了模型结合工具使用完成长程推理的能力，从而训练出了沉思模型GLM-Z1-Rumination。该模型能够主动理解用户需求，在复杂任务中不断优化推理、反复验证与修正假设，使研究成果更加可靠与实用。

在斯坦福大模型中心选定的智能体基准评测AgentBench上，AutoGLM系列模型取得了显著成绩，特别是在Phone Use和Browser Use基准测试中，AutoGLM-Phone和AutoGLM-Web均超越了此前最佳成绩，展现了在网页交互场景中的领先能力。智谱自研的GLM-PC（CogAgent）也在多个权威评测榜单上取得了SOTA成绩，凭借较小的参数规模超越了包括GPT-4o+UGround在内的更大规模模型。

来源：ITBear科技资讯

标签：智能体研究执行 autoglm autoglm沉思

本文地址：https://news.43u.com.cn/a/1025341.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!