解放双手神器!Nanobrowser让小白用自然语言操控浏览器干活

360影视 欧美动漫 2025-03-15 16:24 2

摘要:Nanobrowser是一款基于Chromium内核开发的开源浏览器扩展工具,专注于通过多智能体协作实现复杂网页任务的自动化处理。与需要付费订阅的OpenAI Operator不同,Nanobrowser完全免费且支持本地化运行,用户仅需绑定自己的LLM(大型

Nanobrowser

Nanobrowser是一款基于Chromium内核开发的开源浏览器扩展工具,专注于通过多智能体协作实现复杂网页任务的自动化处理。与需要付费订阅的OpenAI Operator不同,Nanobrowser完全免费且支持本地化运行,用户仅需绑定自己的LLM(大型语言模型)API密钥即可启动智能工作流,数据全程不经过云端服务器,兼顾效率与隐私。

项目代码托管于GitHub,采用Apache 2.0开源协议,开发者可自由查看、修改和二次开发。其核心目标是为普通用户、数据分析师及企业提供零门槛的AI自动化解决方案,覆盖电商比价、数据抓取、表单填写等高频场景。

多智能体协作引擎
系统内置规划器(Planner)、导航器(Navigator)、验证器(Verifier)三种角色:规划器:分解用户指令为可执行步骤(如“提取新闻标题→保存为Excel”)导航器:操控浏览器完成点击、滚动、表单输入等操作验证器:实时检查任务结果,遇到页面加载失败或验证码时自动重试全模型兼容性
支持接入OpenAI GPT-4、Anthropic Claude、Llama3等20+主流LLM,用户可为不同智能体分配专用模型。例如,规划器使用GPT-4保证逻辑严谨性,导航器调用Claude提升操作精准度。零代码交互设计
通过浏览器侧边栏的自然语言聊天界面,用户可直接输入任务指令(如“从京东抓取iPhone 15价格前10的商家”),系统实时反馈执行进度并提供中途修正选项。企业级隐私保护
所有操作均在本地浏览器沙盒中运行,Cookie、账号密码等敏感信息不离开用户设备。支持历史会话加密存储,避免数据泄露风险。动态容错机制
当任务因网页结构变动或网络波动中断时,系统自动回溯执行步骤,调用验证器重新规划路径,成功率较传统脚本工具提升63%。# 从GitHub下载最新版本 wget https://github.com/nanobrowser/nanobrowser/releases/download/v2.0/nanobrowser.zip # 解压后打开Chrome扩展管理页:chrome://extensions/ # 启用开发者模式 → 点击“加载已解压的扩展程序” → 选择解压文件夹

基础指令示例

“从知乎热榜提取前5个话题,保存为Markdown文件” “监控TechCrunch过去24小时融资新闻,发现AIGC相关报道立即邮件通知” “登录163邮箱,将未读邮件标题导出CSV” “在亚马逊上找一个防水设计的便携式蓝牙音箱,50美元以下。它的最低电池寿命应该为10小时”

高级参数设置

参数功能说明示例值--timeout=30单步操作超时时间(秒)防止页面加载卡死--retry=3失败任务重试次数应对验证码等临时障碍--headless无界面模式运行适合服务器定时任务

与同类工具OpenAI Operator的实测对比:

指标NanobrowserOpenAI Operator单任务平均耗时2.1分钟1.8分钟多任务并发能力支持5线程仅单线程月使用成本0元(自备API)$199起隐私安全性本地加密云端传输模型灵活性多模型混搭仅限GPT系列

来源:代码者

相关推荐