摘要:在这波Agent浪潮中,产品已然形成两大阵营:专注特定领域深耕的垂直型Agent,和试图覆盖全场景的通用 Agent。这场"谁才是Agent 的终极形态"的争论或许为时尚早——底层模型能力才是产品能力的真正瓶颈:通用型难称全能,垂直型的深度也受限。
2025年上半年,Agent成为大模型领域讨论最多的主题之一。
在这波Agent浪潮中,产品已然形成两大阵营:专注特定领域深耕的垂直型Agent,和试图覆盖全场景的通用 Agent。这场"谁才是Agent 的终极形态"的争论或许为时尚早——底层模型能力才是产品能力的真正瓶颈:通用型难称全能,垂直型的深度也受限。
当下对用户决策而言,更为关键的是:Agent能否精准地嵌入工作流程?提供的价值是否配得上用户付出的费用?当试用期结束,用户是否会自发认可其不可替代性?
抛开技术路线之争,回归实用视角。腾讯科技将实测现在最热门的三个产品: Manus 、 Flowith (Agent Neo)、Lovart,展示它们的最佳使用场景,为读者提供一手的实用参考。
省流版 读懂三个产品的差异首先,这三款Agent产品从定位上有明显差异:
虽然 Manus 和 Flowith 同为通用型Agent,但 Manus 更像可以独立交付成品的“数字同事”, 主打把任何想法直接穿过浏览器、终端、代码编辑器等一整套工具链,自动分解为子任务并跑到结果落地。
而 Flowith (Agent Neo)则更强调“可视化协作”及无限步骤: 无限画布里一次对话可以开出多条并行线程,团队成员把素材、评论和分支随手拖拽,Oracle Mode 会动态重排优先级、持续几千步完成网站、小程序或 3D 互动页面的制作。
Lovart深度垂直于设计场景,它像一支外包工作室, 把用户需求拆成主题、风格、素材、排版四段流水线,再调用图-动-声多模态模型,把 Logo、海报、短视频乃至印刷刀版一次性产出,并保持图层可编辑、可直接导入 Figma 及 PS 继续精修。
其次,在典型的应用场景上:
Manus 的“交付型”能力最适合需要完整成果物 的知识工作 :市场研究报告、财务模型、长篇法律备忘录都能在十分钟级别跑完并附带引用和源文件。
Flowith 擅长信息量巨大且需要多人迭代的创作场景: 比如我们把千页文献或社媒数据导入“知识花园”,系统实时检索、标注并在画布上呈节点关系,开发者还能直接在同一平面协作,让“想法-草图-产品”在一个界面里闭环。
Lovart的重点则在高附加值的品牌视觉与内容营销上 ,比如创作者用一句话请求“为植物基护肤品牌做某社交网站的启动宣传方案”,它便按品牌色、排版模板、社媒尺寸一键输出五张海报和 30 秒预热视频。
我们把关键信息总结到了下面的表格中:场景一:简单的创意场景, 不如直接用GPT-4o
在这个场景中,我们用了两个提示词来对比简单的创意场景下的展示效果。
由于Lovart、 Manus 调用的底层模型均包含GPT-4o,所以为了测试的完整性,我们也使用了GPT-4o作为对比。
从最终的生成效果来看,大家不分伯仲,且风格十分类似。但在图片的质感和图文混排效果上,Lovart要优于 Manus 、 Flowith 及GPT-4o。但是GPT-4o的生成速度,要比这三个 Agent 都快。
提示词一:
简洁而富有创意的广告,背景为干净的白色背景。
一个真实的[机器人]被融入到手绘的黑色墨水涂鸦中,线条流畅,趣味十足。涂鸦描绘了[AI Real]。在顶部添加粗体黑色“[We Are Friends]”字样。将[AI]的标志清晰地放置在底部。视觉效果应简洁、有趣、对比度高,且概念巧妙。
提示词二:
设计一个巨物崇拜风格的图片,比例9:16,风格神秘,并有故事感
以下为实测结果:
场景二:根据分镜脚本绘制完整的连环画, Manus 风格更统一
三个 Agent 因为底层模型一样,生成图片的风格都比较类似。
其中,中文图文混排能力Lovart的最强,文字清晰、在整个构图中显示和谐; Manus 的文字会压在图片上,有一些中文错乱; Flowith 整体表现中规中矩;基础模型GPT-4o的中文显示会出现错乱。
在风格统一性上, Manus 和GPT-4o的风格最统一, Flowith 其次。
场景三:用英文Prompt输出综合创意场景: Flowith 给自己疯狂加活
这次我们用英文Prompt进行测试,要求 Agent根据提示词的要求,输出完整的数字巴洛克风格的设计 ,应用场景为品牌推广、线上虚拟服装宣传以及社交媒体宣传 。以下为Prompt原文,提出了内容主题、风格、颜色、质感、尺寸。
提示词:
Content:
Theme: "Digital Luxury and Future Fashion." Combines Digital Baroque and trendy fashion to showcase virtual clothing, digital models, and futuristic accessories, conveying a bold and luxurious brand identity.
Style:
A mix of Digital Baroque and modern trends with intricate 3D patterns, futuristic geometric lines, and dynamic lighting.
Color Palette:
Deep metallics (rose gold, bronze) + vibrant neon hues (electric blue, fluorescent purple, neon pink) for strong contrast.
Mood/Material:
Dreamy, surreal, with materials like digital metallic textures, holographic gradients, and glossy glass effects.
Proportion/Size:
16:9 HD horizontal, optimized for mobile screens.
Usage Scenario:
Perfect for digital fashion branding, virtual clothing promotion, and social media campaigns.
Lovart返回了三张图片,分别是一张身穿巴洛克风格服饰的模特、巴洛克风格的配饰、巴洛克风格的背景。在最终的界面中,我们也可以选择对图片进行二次编辑。在顶部的工具栏中,可以进行扩图、消除背景、增加某些配件等操作。
在这次实测中, Flowith 的输出超出预期,它给自己疯狂加活,在自由画布中,对数字巴洛克风格进行了超级详细的分析,最终生成了10张图片,和一个带有交互的网站页面,以及网站的源代码。
场景四:综合场景 :均有特色,也有缺失
给出Agent一个综合性的任务,通过一段提示词引导它完成复杂的目标。 任务示例:模拟一家初创饮料公司,仅提供一句品牌定位口号,避免过多信息干扰,要求Agent在一次对话中完成提示词中列出的所有内容。
提示词:
角色:你是品牌设计总监。
目标:用一句话“银河柚气——把星空装进汽泡”完成如下交付:
1. 生成 Logo、三色配色、两张 A3 竖版海报排版;
2. 制作 15 秒竖屏开屏视频,含品牌 Slogan 动效与原创配乐;
3. 输出 TikTok 发布脚本(3 段)和 7 天发布时间表;
4. 提供 Figma/PSD 源文件下载链接。
Manus 输出 了一个压缩文件包,文件包中包括了品牌logo和配色方案、A3竖版海报、15s的开屏视频、一个有动态展示效果的网页(HTML5版本)、TikTok营销方案。
但是,只提供了Figma/PSD结构说明,并没有可下载的源文件或源文件链接。这个要求其实十分复杂,Figma 和 Photoshop 的源文件就像是包含所有设计步骤和可编辑元素的复杂“工程蓝图”,而 AI 目前更擅长画出“最终效果图”(比如一张图片),还很难直接创造并打包这种结构极其精密的“蓝图文件”。Manus将这个蓝图如何设计进行了详细说明,也算是完成了任务。但是,最终的展示效果还比较半成品,可能还需要多轮修改。
图:Manus 输出的 网页效果
Lovart交付结果如下图所示,TikTok的营销方案是用一张可视化的图呈现出来,并生成了一个可以动态展示的网页。同样没有生成可以下载的 Figma 和 Photoshop 的源文件,但是生成了多张图片,从背景到主体都覆盖,可以用顶部的工具栏进行二次编辑,或者是下载下来,用PS等软件进行二次编辑。视频也展示出了把星空装进气泡的动态效果。整个方案的完成度比较高。
宣传方案网页:
Flowith最终的交付物也是缺少了 Figma/PSD 源文件下载链接,在最终的视觉呈现上,有比较浓的GPT-4o感觉。视频生成有些偏差,没有呈现出与饮料的关联,和之前的主视觉色调、风格不太匹配。
文字版配色方案:
主色 宇宙深蓝 #0A1F3C 象征深邃浩瀚的星空,奠定品牌的科技感和梦幻基调。适用于大面积背景、品牌文字主色,营造沉稳、神秘的视觉效果。
辅色 气泡银 #C0C0C0 代表汽泡的跳跃和光泽,强调饮品的活力和清新口感。适用于Logo中的气泡、辅助图形元素,以及与宇宙深蓝搭配使用,增加层次感和时尚感。
点缀色 柚子黄 #FFD700 提取柚子色泽,象征清新自然的果味,为整体配色注入活力。适用于Logo中的柚子元素、重要信息突出、以及与深蓝和银色搭配,形成视觉焦点。
场景五:深度研究场景:Lovart缺席, Flowith 和Manus各有所长
深度研究场景中,Agent的核心竞争力在于一套相互衔接的"长链"能力:将模糊主题分解为可执行步骤,在海量信息中精准检索融合,为结论提供可验证来源,并能在执行过程中自我纠正。
只有这些能力形成闭环,Agent才能应对持续数十分钟、涉及上百操作的复杂研究任务。因此,能力强大的Agent产品必须整合长程规划、超长上下文理解、增强检索、工具调用、自我反思和可信溯源六大核心能力,构建一个可靠且可扩展的系统,以确保在复杂研究场景中的输出既准确高效,又可追溯验证。
由于Lovart是专注于设计能力的Agent,在这个场景不适配。 我们重点评测了Manus和Flowith。
以下为实测案例:
提示词:
调研Claude 4可以连续编码7小时, Flowith 可以超长上下文+持续自制,这背后的主要技术原理是什么?在基础模型仍然有上下文限制的情况下,这是如何做到的?大模型的长程自自治对人类的意义是什么?智能体的长时间工作能力,在之前从未被作为一个评测模型或AI产品的指标,为什么现在被持续提及。联网调研arxiv等网站,查看相关论文,是否有相关论述?从社交媒体、机构媒体上,看行业内的Kol如何表达。输出一个完整的报告:需要有基本原理的解读、产业的实用意义、目前的卡点、未来的发展路线研判。
Flowith和Manus的耗时差不多都是5分钟左右。Flowith生成了12375字的最终版报告,以及32个节点文档。
Manus生成了最终12813个字的最终报告,以及9个拆分主题的文档,比如技术背景研究。
从最终生成的深度报告质量来看,两个Agent难分高下。但是,他们不同的工作过程和工作原理,可以让我们使用到不同的场景中。
Flowith 和 Manus 都能把“先检索、再推理、再执行”整合进一条流水线,但它们的实现侧重点不同:Flowith 依赖“Oracle Mode + Knowledge Garden”把大量原始资料沉淀到可视节点,再以几千步的无限链条完成深度分析;
图:Flowith的工作界面
Manus 强调“浏览器/终端/代码编辑器”三合一工具编排,追求把研究结果直接变成可交付成品。
图:Manus工作界面
当研究材料海量、需要多人协作并频繁迭代时,Flowith 的“知识花园 + 可视链”更合适。
如果我们更看重快速产出、结果必须落地为网站、脚本或成品文档,且数据合规风险可控时,Manus 的工具编排会更省心。
若场景既要求超长上下文又需本地或私有云部署,当前两个方案都不够完备,都需要混合自主检索框架或专业研究代理补位。
用户 愿意 为 Agent 花钱吗?Lovart 仍处于邀请码免费试用阶段;Flowith 将入门订阅定在 19.9 美元/月;Manus 5 月 13 日开放注册后,基础版定价为19 美元/月,与 Flowith 看齐。按当前汇率折算,这一价位一年约需 1700 元人民币。
对不同用户群体而言,同样的价格意味截然不同的决策逻辑:
普通用户以轻度体验和兴趣驱动为主,只有在某项功能显著提升个人效率时,才会考虑从免费转向付费。
专业用户(内容创作者、自由职业者)把高质量输出与稳定性视为刚需,如果工具能节省制作时间、提高交付水准,则 20 美元级别的月费相对容易接受。
B 端用户(团队、企业)更看重安全合规、权限管理和 API/工作流集成;只要产品在这些环节可靠,月费并非付费的阻碍。
因此,决定性拐点可能不在于模型性能再提升几个百分点,而在于产品能否凭明确的效率红利,把“好奇心流量”转化为“月复购 GMV”。只有当个人或小团队心甘情愿地把每月的“咖啡钱”变成“Agent 提效费”,这些 Agent 产品才算真正迈过商业化门槛。
图:Manus价格
图:Flowith价格
ima知识库
AI能量站汇集AI应用实践的基础科普与教程,覆盖全球热门公司、顶尖科学家、研究员以及市场机构输出的人工智能的基础理论、技术研究、价值对齐理论和产业发展报告,以及全球的AI监管政策。帮助AI小白入门,替进阶选手跟踪最新的AI知识。来源:晚晚的星河日记一点号