智谱AutoGLM沉思:AI新突破,深度研究与执行一体,性能直追DeepSeek-R1

360影视 日韩动漫 2025-03-31 16:36 2

摘要:在科技界的一次重大突破中,中关村论坛上亮相了一款名为AutoGLM沉思的创新AI产品,该产品由智谱公司推出,标志着全球首个集深度研究与实际操作能力于一体的智能体(Agent)的诞生。

在科技界的一次重大突破中,中关村论坛上亮相了一款名为AutoGLM沉思的创新AI产品,该产品由智谱公司推出,标志着全球首个集深度研究与实际操作能力于一体的智能体(Agent)的诞生。

AutoGLM沉思通过一系列技术创新,成功打破了实时联网搜索、动态工具调用、深度分析及自我验证的界限,实现了长程推理和任务执行的无缝衔接。这一成就不仅在国内首次正式开放了Deep Research功能,更将AI技术的应用推向了新的高度。

据智谱内部评估,AutoGLM沉思背后的核心——深度思考模型GLM-Z1-Air,在性能上已能与业界领先的DeepSeek-R1(671B,激活37B)相媲美。目前,该功能已在智谱清言的网页端、PC端及手机App上全面上线,且对用户免费开放,不限量使用。

AutoGLM沉思的发布版本为preview版,主要面向研究场景,而智谱计划在未来两周内进一步扩展其智能体执行能力,并推出“虚拟机”版本。技术演进路径涵盖了从GLM-4基座模型,经由GLM-Z1推理模型,到GLM-Z1-Rumination沉思模型,最终进化为AutoGLM模型的全过程。其中,核心链路的模型和技术将于4月14日正式开源,并陆续在MaaS平台上线。

AutoGLM沉思的设计初衷是让机器不仅具备思考能力,还能主动行动,实现“边想边干”。这一能力的实现依托于三大关键特性:深度思考、感知世界以及工具使用。AutoGLM沉思融合了这些能力,超越了OpenAI的Deep Research,不仅擅长深入研究,更能真正执行任务,使AI Agent从单纯的思考者进化为能够交付结果的智能执行者。

在技术细节上,智谱重新训练了320亿参数的基座模型GLM-4-Air-0414,通过加入更多代码类、推理类数据,并针对智能体能力进行优化,显著提升了模型在工具调用、联网搜索及代码任务上的表现。GLM-4-Air-0414以较小的参数量实现了与更大规模模型的比肩效果,特别适用于涉及多轮复杂交互的智能体任务。

基于GLM-4-Air-0414,智谱推出了全新的深度思考模型GLM-Z1-Air,通过引入更多推理类数据并在对齐阶段深度优化通用能力,使其在性能上与DeepSeek-R1相媲美,且在推理速度上提升了8倍,成本降低至1/30。GLM-Z1-Air还能在消费级显卡上运行,进一步降低了使用门槛。

智谱通过扩展强化学习训练,提升了模型结合工具使用完成长程推理的能力,从而训练出了沉思模型GLM-Z1-Rumination。该模型能够主动理解用户需求,在复杂任务中不断优化推理、反复验证与修正假设,使研究成果更加可靠与实用。

在斯坦福大模型中心选定的智能体基准评测AgentBench上,AutoGLM系列模型取得了显著成绩,特别是在Phone Use和Browser Use基准测试中,AutoGLM-Phone和AutoGLM-Web均超越了此前最佳成绩,展现了在网页交互场景中的领先能力。智谱自研的GLM-PC(CogAgent)也在多个权威评测榜单上取得了SOTA成绩,凭借较小的参数规模超越了包括GPT-4o+UGround在内的更大规模模型。

来源:ITBear科技资讯

相关推荐