摘要:LangManus 使用三层 LLM 系统,分别用于推理、基础任务和视觉语言任务。
LangManus 实现了一个分层的多智能体系统,其中有一个主管智能体协调专门的智能体来完成复杂任务. 其中:
Qwen:提供开源语言模型
Tavily:提供搜索能力
Jina:提供网络爬虫技术
Browser-use:提供浏览器控制能力
LangChain:支撑 LLM 交互和链式操作
LangGraph:为复杂多智能体编排提供支持
LangManus 使用三层 LLM 系统,分别用于推理、基础任务和视觉语言任务。
系统由以下智能体协同工作:
协调员(Coordinator):工作流程的入口点,处理初始交互并路由任务
规划员(Planner):分析任务并制定执行策略
主管(Supervisor):监督和管理其他智能体的执行
研究员(Researcher):收集和分析信息
程序员(Coder):负责代码生成和修改
浏览器(Browser):执行网页浏览和信息检索
汇报员(Reporter):生成工作流结果的报告和总结
核心智能体角色
主管(src/prompts/supervisor.md):通过分析请求并确定由哪个专家处理来协调团队并分配任务。负责决定任务完成情况和工作流转换。
研究员(src/prompts/researcher.md):专门通过网络搜索和数据收集来收集信息。使用 Tavily 搜索和网络爬取功能,避免数学计算或文件操作。
程序员(src/prompts/coder.md):专业软件工程师角色,专注于 Python 和 bash 脚本。处理:
Python 代码执行和分析
Shell 命令执行
技术问题解决和实现
文件管理员(src/prompts/file_manager.md):处理所有文件系统操作,重点是正确格式化和保存 markdown 格式的内容。
浏览器(src/prompts/browser.md):网络交互专家,处理:
网站导航
页面交互(点击、输入、滚动)
从网页提取内容
提示系统使用模板引擎(src/prompts/template.py)来:
加载特定角色的 markdown 模板
处理变量替换(如当前时间、团队成员信息)
为每个智能体格式化系统提示
每个智能体的提示都在单独的 markdown 文件中定义,这样无需更改底层代码就可以轻松修改行为和职责。
来源:夏琳看科技