三小时复现Manus,开源的OpenManus带来哪些启示?

360影视 动漫周边 2025-03-09 02:34 1

摘要:凌晨三点敲完代码,次日早上八点新增三十多个好友申请,在开源社区GitHub上迅速收获7000多颗星星——Manus爆红不足三日,隶属于国内AI Agent初创公司DeepWisdom(深度赋智)的MetaGPT 团队,就进行了产品复刻,并将产品Open Man

凌晨三点敲完代码,次日早上八点新增三十多个好友申请,在开源社区GitHub上迅速收获7000多颗星星——Manus爆红不足三日,隶属于国内AI Agent初创公司DeepWisdom(深度赋智)的MetaGPT 团队,就进行了产品复刻,并将产品Open Manus上传至开源社区。

第一财经记者对话MetaGPT 团队,试图理清此次技术复刻的底层逻辑,以及行业喧嚣背后的意义。 这一过程既反映出产品功能复刻离不开DeepWisdom公司具备的技术沉淀,也通过MetaGPT 团队的视角肯定了Manus团队在规划、后训练、交互方式等方面的投入。

在复刻过程中理解差异

早在2023年,MetaGPT 团队开始研究多智能体框架,并在 GitHub 上开源相关代码,获得了社区的广泛关注。2024年10月,团队开始探索 Agent 的规划能力和工具使用能力,提出Data Interpreter等工作。

Manus火了之后,MetaGPTAI算法研究员向劲宇与MetaGPT算法研究员梁新兵讨论:是否可以直接做一个开源版本。

在具体产品属性上,OpenManus 是类Manus的多智能体框架,为开发者提供了快速上手和定制化开发的平台,但向劲宇也不忘提醒:目前OpenManus是demo级(演示版本),暂时还没有GALA benchmark评测结果,效果可能一般。后续团队会进一步投入DeepResearch方向与SWE(软件工程)代码方向。

此前Manus披露在GALA Benchmark 评测中达到当前最优水平(SOTA),超越OpenAI 的 Deep Research 等竞品。

向劲宇推测,Manus团队本身实现了非常复杂的规划与后训练,才能够如同其demo提供良好的产品交互。Manus面临效果不理想时的问题也是行业性问题,OpenManus暂时也没有达到非常强的效果。

对于三小时便能够复刻“爆品”Manus,梁新兵对第一财经记者表示,本质在于团队已储备的技术积淀,且前两个月前团队已经在思考如何通过简单的、优雅的形式,去呈现一个Agent形态。

从Manus与OpenManus对外披露的演示视频来看,两者均属于AI Agent 产品,采用Multi-Agent(多智能体)架构,能够将复杂任务拆解为多个子任务,并分配给不同的Agent(智能体)执行。另外,两者均具备工具链集成属性,集成多种工具,如网络搜索、代码执行、文件处理等,以增强智能体的功能。

相较而言,两者最大差异在于OpenManus的开源属性。与Manus的技术架构主要依靠使用者猜测不同,OpenManus产品团队直接在项目致谢中提及Claude厂商Anthropic去年上线的computer-use,YC投资的项目browser-use等。OpenManus作者张佳钇公开总结产品成果结合了computer-use、基本的Agents,以及规划能力。

多智能体将普及

与其关注Manus刚刚出圈时的诸多噱头,不如将目光聚焦在Manus模式给行业发展带来的启示。

梁新兵认为,Manus让更多普通人了解到智能体为何物,放大了Multi-Agent这条路径。

从发展历史来看,Multi-Agent概念雏形最早可以追溯至20世纪80年代,分布式人工智能理念兴起。2017年以后,随着大型语言模型成熟,AI Agent应用开始从理论走向实际,例如AutoGPT 的出现标志着AI Agent的雏形诞生。

2024年,微软、谷歌、苹果、OpenAI等厂商纷纷布局AI Agent市场。2025年1月,OpenAI发布首款AI Agent产品Operator,能够执行复杂操作,如编写代码、预订旅行等,但目前仅提供给购买每月200美元 ChatGPT Pro 服务方案的消费者。直到国内AI厂商Monica通过Manus,让普通群众第一次意识到Multi-Agent概念,MetaGPT的开源产品进一步揭开其神秘面纱。

AIGCLINK发起人、行行AI合伙人占冰强对记者表示,Manus此类产品类型,之前MetaGPT团队已经实现过,也算是国内首批投入智能体研发的团队之一。

MetaGPT NLP/Agent方向研究员洪思睿在交流中表示,目前的行业发展状态中,通过大模型或Agent去做工具的使用,已经不再新奇。随着大家对具体产品与技术的关注越来越多,行业的技术难点在于:当很多相似的工具可解决同样的问题,如何让Agent把决策做得更好。另外,如果使用过程中接入的不是比较标准的工具接口,工具参数也可能出错,进而导致工具的执行效果不理想。

这样的背景下,通过动态路由技术优化工具选择与使用,通过知识增强与幻觉抑制提升决策可靠性,采用ReAct、Chain-of-Thought(CoT)或 Tree-of-Thoughts(ToT)等推理框架帮助 Agent 更清晰地展示决策过程,成为可选择的解决措施。

MCP协议(Model Context Protocol,模型上下文协议)目前成为了业内的主流选项。所谓MCP,是由Anthropic于2024年11月底推出的一种开放标准协议,旨在统一大型语言模型(LLM)与外部数据源和工具之间的通信。它通过标准化接口,使LLM能够安全、高效地访问外部资源,从而扩展其功能。

占冰强对记者表示,MCP本身完全可兼容,主要看技术厂商是否愿意支持。目前海外主流厂商已逐步接入,尤其是在AI工具和开发平台领域,相信国内厂商也会陆续跟进。

来源:速热式电热水器

相关推荐