摘要:在漫威电影宇宙中,Jarvis 是钢铁侠托尼·斯塔克的私人人工智能助手,无处不在,随时随地为托尼提供支持和帮助。Jarvis 不仅是一个简单的语音助手,它还深入融入了托尼的生活,管理他的日常事务,控制他的高科技设备,甚至在战斗中提供实时的战术建议。Jarvis
在漫威电影宇宙中,Jarvis 是钢铁侠托尼·斯塔克的私人人工智能助手,无处不在,随时随地为托尼提供支持和帮助。Jarvis 不仅是一个简单的语音助手,它还深入融入了托尼的生活,管理他的日常事务,控制他的高科技设备,甚至在战斗中提供实时的战术建议。Jarvis 的存在让托尼能够专注于更重要的事情,因为他知道有一个可靠的助手在背后支持他。
在过去的一个月里,我们对 Fellou 浏览器进行了深层次的架构调整和全面优化。这一系列的改进不仅提升了性能和稳定性,让你的体验更流畅,还赋予了 Fellou 更强的行动力与交付力。今天,我们非常自豪地宣布,Fellou 2.0 已经向我们梦想中的类 Jarvis 通用智能体迈出了重要的一步。
我们希望 Fellou 不仅仅是一个工具,而是一个可以融入用户日常生活的智能伙伴。我们的愿景是让 Fellou 成为用户生活中不可或缺的一部分,随时随地为用户提供帮助和支持,而不只是一个飘在云端的虚拟助手。
从这篇文章中,你将了解:
我们为什么要以 Agentic Browser 为中心构建梦想中的 Jarvis?Fellou Browser 2.0:开启 AI 的批量化生产Fellou 2.0 获得成功的关键 —— Eko 2.0,一个关键的开源 Browseruse 基础设施Fellou 的下一步计划Why Agentic Browser?
Agentic Browser 代表一种以浏览器为载体的通用智能体,不仅能访问互联网,更能够理解用户的需求,并自动拆解复杂的任务。其设计初衷是为了让智能体在拥有用户完整上下文的前提下为用户交付更好的结果,我们希望彻底改变用户与网络和计算机互动的方式。
Fellou 依赖其独特的 Browser + Workflow + Agent 架构,开创了 Agentic Browser 这一新品类,打造了一个像「自动驾驶汽车」一样可以「自动冲浪」的浏览器智能体。
想象一下,你不再需要在多个应用程序之间切换来完成一项任务。Fellou 可以为你自动化整个流程,从信息收集、数据分析,到最终的任务执行和结果交付。无论是进行市场调研、报告生成,还是制作音乐、生成 3D 设计环境、制作 Logo,Fellou 都能为你提供端到端的解决方案。
Fellou 的目标是让用户能因为 Fellou 的存在而找到幸福,这种幸福是释放双手的幸福,解放重复劳动的幸福,脱困于格子间、电脑前和写字楼的幸福 —— 但并非不劳动。人们会从劳动中获得满足感,Fellou 的存在是让人们去做有更多巴胺的工作,而那些消磨精神、耐心和体力的工作都可以留给 Fellou。
时间对于每个人来说都是不可再生资源,让人有时间且有做自己的自由 —— 是 Fellou 的初心。
这也是我们设计开发 Fellou,以及坚持 Agentic Browser 方向的最基础原因 —— 我们相信 AI 的发展会加速更多人的创造需求,而不是减少人们的工作机会,人类和 AI 是协作与成就的关系而非对立的关系,而 Fellou 作为一个浏览器客户端,在用户本地的设备里,就是那个有人们最多记忆、最多偏好、最了解用户、无处不在、有求必应的、融入用户生活的通用智能体。
我们带着这份期许,为了给用户交付更多更好的结果,完成了 Fellou 2.0 的升级。
Fellou Browser 2.0:开启 AI 的批量化生产
总结下 2.0 的升级概要为:
更快:减少等待,多任务并行,交付更多;更惊人:多样任务交付,7 * 24 全天候执行;更可靠:生产级多样化场景覆盖,成功率大幅提升,从 31% 到 80%;更快:减少等待,多任务并行,交付更多
得益于大量、全面、多维度优化,Fellou 2.0 在速度上取得了突破性进展,相比 Fellou 1.x 的版本,Fellou 在不同任务的执行速度上提升了 1.3 - 1.5 倍,相比较某些通用 Agent,我们在不同任务上皆有非常大的速度优势,如:
任务 1:生成一个 3D minecraft 的场景,里面有埃菲尔铁塔。
Fellou 耗时:1 分 20 秒
Fellou 交付物:https://chat.dev.fellou.ai/sites/3d-minecraft-eiffel-tower-NdSWZGi_
某通用 Agent 耗时:4 分 30 秒
任务 2:把“Fellou 是世界首个 Agentic Browser” 转化成摩斯密码,然后生成一个音频,用 MP3 格式。
Fellou 耗时:1 分 30 秒
Fellou 交付物:
某通用 Agent 耗时:2 分 30 秒
任务 3:用 HTML 做一个贪吃蛇游戏
Fellou 耗时:1 分 20 秒
Fellou 交付物:https://chat.dev.fellou.ai/sites/snake-game-classic-retro-fun-aiz5HkaM
某通用 Agent 耗时:6 分钟
任务4:据 {https://www.notion.so/A-Quick-Tour-of-What-Fellou-Can-Do-1ca36270eaab80f8b8afde217a2942a8?pvs=4},帮我生成的推广信息分别发布到 Twitter、Linkedin 、Hacker News 中,推广信息长度必须 200 字符以内。
[10_Final.mp4]
Fellou 成功执行。
某些通用 Agent 执行失败,没有能将生成的推广信息分别发布到 Twitter、Linkedin 、Hacker News 中,只生成了推广信息。
同时,我们优化了多任务并行的功能,使得用户能同时给 Fellou 下达多个任务,大大提升用户的多线程工作能力:
任务 A:根据{@Youtube AI 相关视频},创建为一个网站,网站内总结这段视频的核心知识,内容包括视频的主要观点、他是如何解释 AI Agents 和 Agentic Reasoning 的,以及这在 AI 发展的意义和应用趋势。网站最后需要出几个考题,来检验是否习得了这些知识。
任务 B:将这个{@Google Sheet 账单}作为数据源, 并生成一个账单分析网站。网站需要可以从各个维度做自定义筛选。
注:并行任务目前仍处于 Alpha 阶段,在正式版本中会大不一样。
更惊人:多样化任务交付,全天候 7 * 24 执行
通过提供多样化 Agent (如 Browser Agent、Coding Agent、File Agent、Shell Agent、Computer-use Agent 等)协作,提供跨应用生产力 Workflow、报告、文本、图片、网站、PPT、CSV、Excel、Word、MP3、视频转语音、Logo 生成以及总结 Youtube 视频等多样化的交付物。
Marketing 任务(跨应用生产力 Workflow):搜索 Reddit/ Twitter / Youtube / Tiktok 上近 1 个星期发布的关于浏览器的帖子,在帖子下发布评论安利 Fellou AI. / Search for posts about the browser posted on Reddit/ Twitter/ Youtube/ Tiktok in the past week, and comment on the posts to recommend Fellou AI.
网页交付任务:创建一个自适应冥想应用,根据用户输入的当前情绪状态和冥想目标,生成个性化的声音指导。结合生物节拍(binaural beats)、自然声音和动态引导语音,创造有助于冥想的声音环境 / Create an adaptive meditation app that generates personalized audio guidance based on the user's current emotional state and meditation goals. Combine binaural beats, natural sounds, and dynamic guided voiceovers to create a sound environment that supports effective meditation.
音频交付任务:为智能家居设备生成整一套反馈音效 / Generate a complete set of feedback sound effects for smart home devices
音乐交付任务:今天晚上我们要开 party,大家想唱周杰伦的歌,所以帮我找几首他的热门歌曲,然后在中间写点串联和弦之类的,把这些歌串起来,最后返回串好的完整伴奏。ps需要钢琴版。加点复杂音效,我喜欢实验性音效比如Pink Floyd,或者Nujabes喜欢用的那些。
Fellou 交付物:
Logo 交付任务:搜索尤溪县的建筑风格、文化和形象,帮我做一个 logo,文字:尤溪县城市文旅,元素包含朱熹的形象,金柑的造型,八山一水一分田的山水风光形象,最好的是一个元素里体现三个意思。元素要少,避免复杂像徽章,背景白色扁平简洁。中文的占比是 2x,英文是 1x,图形是 6x。颜色严格控制在 2 色以内,矢量,扁平,美观,产出 10 个陈幼坚的设计风格,其中一个要有 尤溪县 的文化底蕴和形象在其中,另外一个要有刘伯温故居的 logo 设计风格,再有一个把朱熹的头像融入进去。/ Using SVG to redesign a logo for a cutting-edge technology company OPENAI that embodies innovation, modernity, and forward-thinking.
Fellou 交付物:https://08u2zrwnmc.dev.fellou.io/youxi-county-urban-tourism-logo-design-bLN_gEIw
除此之外,Fellou 2.0 还提供了超长上下文管理,特别是监听类任务(如:Slack、Discord 新消息监听、邮件监听、网页内容变化监听)实现了无限步长,真正解决长流程和复杂场景的问题。
监控 Gmail 任务:监控我的 gmail,当有用户产品反馈相关的邮件时,用友好的方式回复邮件表达感谢。同时拆解用户邮件中提到的需求和 Bug,并填充在 {airtable 的反馈表} 中。Monitor my gmail account and reply to user product feedback emails in a friendly way to express my gratitude. I also break down the requirements and bugs mentioned in the user emails and fill them in the {airtable feedback form}.
跨境电商监控谈价任务:监控 SalesSmartly,回答用户的问题,引导用户完成下单,当用户询问价格的时候,按价格表给到报价,当用户询问物流时间的时候,根据物流时间表给到预计的配送时间,当用户砍价的时候,不能低于我们的底价,预计低价持续的和用户沟通,用户确认订单后立刻生成一个下单的 csv 表(包含:商品名称 + 商品数量 + 商品的单价)。
更可靠:生产级多样化场景覆盖,成功率大幅提升,从 31% 到 80%
生产级的意思是更加贴近用户的实际需求,更加端到端,更加无人化,更贴近“现实”,比如:信息填报、信息搬运、社媒运营、招聘流程闭环、跨境电商自动谈单等多样化场景应用。
找人任务:找到我上传的 PDF 里面前五个的 Author,再帮我找到他们的全部背景信息和联系方式,背景信息包括 Homepage、GoogleScholar 链接、Github 链接,联系方式包括邮箱以及电话,你可以通过他们的 Github Repo 提交历史 URL 和 .patch 拼接后找他们的提交 Email,以及在 contact out(www.contactout.com) 上找他们的 Email 和电话,所有的链接要求是完整的 URL。
Marketing 任务:找到 Twitter / Instragram / Youtube / Tiktok 上分别找到粉丝数量在 10k+ 的 20 个宠物博主,同时私信询问她们是否可以合作推广 A 品牌猫粮。YouTube无法私信忽略。把博主信息整理成网页报告 / Find 2 pet bloggers with 10k+ followers on Twitter / Instragram / Youtube / Tiktok, and send them private messages to ask if they can cooperate in promoting Brand A cat food. Ignore the private message step for YouTube. Summarize the basic information of the bloggers into a web report.
找工作任务:基于上传的简历文件内容帮我在 Linkedin 找到位于硅谷的适合我的工作,找到这些工作在领英中的人,基于简历内容填写网页表单并提交,然后结束运行。
找工作任务:在 BOSS 直聘上找到最新发布的前端工程师的岗位,结合对应的岗位描述和我上传的简历内容写一段自我介绍,并通过“立即沟通”将自我介绍发送给招聘者。发送10次。
以上任务还只是冰山一角,更多任务等待发现,这来自于Eko 2.0 的新架构,在 Online-mind2web 榜单中,任务完成率从 31% 提升到了 80%。
Fellou 2.0 获得成功的关键 —— Eko 2.0,一个关键的开源 Browseruse 基础设施
基于全新 Eko 2.0 架构,任务成功率由 31% 提升至 80%(在 Online-Mind2web 基准测试中实现 SOTA 表现)。
Eko 的定位是一个 Browseruse 和 Computeruse 的框架,在 Eko 2.0 中,我们提供了 Multi Agent,DOM 状态变化监听、Loop Tasks 管理、Workflow 规划等多项必须的基建能力,开源 Eko 2.0 给社区的决定深深植根于我们的技术信仰,这种信仰不仅仅是对技术本身的热爱,更是对更好的塑造 GUI Agent 未来的坚定信念。
Fellou 的下一步计划
Fellou 正在加速变得更加聪明。
如果以少量总结,则是:
Fellou 很快会推出 Windows 版本;Fellou 很快会取消邀请码机制;Fellou 的模型智能会飞快提升,将会有更丰富的交付物;Fellou 将持续优化用户体验,体现在:更快的速度,Agentic Workflow 和浏览器性能两者兼备;更好的交互,更完整的对话上下文感知 / 理解 / 记忆 / 多轮对话,以及更好融合 AI 能力的交互界面;更多大家期待功能的补齐,比如迁移工具、密码管理器等;关于你的下一步:
对于未使用过 Fellou 的用户,可访问 fellou.ai 申请使用 Fellou,我们会持续发放邀请码;对于 Fellou 的老用户:本次升级架构更新较大,2.0 以下的版本已不可用,打开已经安装好的 Fellou 将收到我们逐步推送的更新,也可以到官网(fellou.ai/download)手动下载最新版本;目前 Fellou 2.0 仍处在内测阶段,在对话框中可使用 "Use Workflow: " 启用最新版能力;在执行长任务时,推荐提示 Fellou 进行搜索,搜索的东西越多、提示词越精确产出效果会越好;谢扬 · 好事不怕晚
2025 年 06 月 03 日
来源:品玩