深度体验扣子空间,我只能说差强人意

360影视 动漫周边 2025-04-23 12:44 2

摘要:本文深度体验了类 Manus 产品扣子空间,通过多项任务测试其功能表现。在数据处理任务中表现出色,但在其他任务上整体表现中规中矩,亮点不足。

本文深度体验了类 Manus 产品扣子空间,通过多项任务测试其功能表现。在数据处理任务中表现出色,但在其他任务上整体表现中规中矩,亮点不足。

上周末拿到了 Coze 空间的邀请码,又一个类 Manus 产品,果然 Manus 带来的这股浪潮,不单带火了 Genspark,也让大厂迅速布局。

闲话少叙,刚体验完 Flowith 的 Oracle 模式(见爆肝 5 小时,我用 Flowith 做了一款问卷数据清洗工具来解决真实工作问题),现在拿同样的任务来测试下。

任务一:制作分享卡片

生成一个可交互式的分享卡片网页:
网页提供输入框供用户输入,文案提示:请输入您想要分享的内容,不超过 100 字;
用户输入后,点击确认按钮,进行卡片生成;
生成卡片背景颜色使用渐变色,有毛玻璃特效;

生成效果如下:

总的来说,基本符合 prompt 的需求,但是毛玻璃的效果实现得不好,色太重。当然这一点 Flowith 也有问题,它的毛玻璃效果太轻。

我嫌弃这个效果太差,索性不要背景色:

生成一个可交互式的分享卡片网页:网页提供输入框供用户输入,文案提示:请输入您想要分享的内容,不超过 100 字;用户输入后,点击确认按钮,进行卡片生成;生成卡片使用毛玻璃特效;

但生成的效果依然难以令我满意,很难看出毛玻璃的特效:

甚至我之后又喂了一篇如何制作毛玻璃效果的知乎文章,让它先参考,但效果仍然不如任意。相反,同样的提示词,在 Flowith 上就好很多:

综上,在生成【分享卡片】这一任务上,两者总体上半斤八两,在毛玻璃生成这块,我更喜欢 Flowith 在那一次生成的效果,不过也不能就因此说 Coze 更差,毕竟大模型具有偶然性,重点是看它对于需求的执行。

接着来看第二个任务 【名人金句生成】

帮我创建一个网站,该网站能够随机生成一些名人的金句,并以卡片形式展示:用户可以选择:鲁迅、古龙、金庸三位作家;选择作家后,点击【生成金句】,系统将从所选作家的作品中挑选出一句金句并展示;金句以卡片形式展示,渐变色背景,支持用户选择;同时增加粒子移动特效;

这一次让我挺惊喜的,虽然第一次生成存在缺陷,比如粒子特效增加在整个网页背景上而非只是卡片,并且缺少了金庸,但我只优化了一次就达到了满意的效果:

有三个地方需要优化:粒子特效只在分享卡片中存在;缺少金庸的选项;缺少渐变色的选项;

同样的任务和提示词,Flowith 完成并不好,主要是粒子特效这块,我修改了五六次提示词,才让粒子动起来,而 Coze 只优化了一次,这一点来说,我认为 Coze 完成得更好。

接下来是第三个任务,也是我用 Flowith 做起来特别吃力的一个任务【货币数据清洗并进行汇率换算】。

我在测评 Flowith 的文章里提到,因为是用画布,所以直接用 Flowith 处理数据,会非常卡顿,同时画布会拉得很长。但 Coze 不会,它的处理过程封装在一个状态提示框里,所以在渲染上较画布更为丝滑(但相反就没有多线程运行比较的优点)。

所以,当我直接把 Flowith 怎么也完成不了的提示词提供给 Coze 时,它竟一步到位,直接调用 Python 处理了原始的 Excel 文件,并一遍得出我想要的结果 !

文档中每一列包含货币数字和单位,请将每一列换算成美元计算换算成美元后,所有列加在一起的平均数无任何数字可以无视如果只含数字不含货币单位则视为美元输出格式:原数值 原货币单位 换算后美元

结果让我很惊喜,虽然我发现它把一些含有字符的原始数据清掉了,而且汇率的换算我不确定是否正确,于是我又微调了一遍:

有些问题:
1. 含有字符的数据被清除了,这里不要改动,要调用大模型和联网去理解它,看怎么转化;
2. 纯文字的,无法理解成货币的,就用 N/A;
3. 增加一列,货币同美元的当前汇率,便于核实;

这一次,它的结果相对令我满意:

再进行最后一次调优:

再优化下,按如下列名称生成 Excel:
1. 原数据 (例:$10);
2. 货币数值(例:10);
3. 货币代码(例:$);
4. 当前汇率(例:1.2);

完美 !正是我想要的!

在数据处理这块(尤其是对于表格),Coze 已经达到令我满意的水平,相比于 Flowith,Coze 空间无疑更适合办公人士使用,何况它还集成了飞书文档的 MCP,可以直接调用/写入飞书中的文档内容。我很赞同阮一峰老师的观点,Agent 结合飞书会是办公领域的一柄大杀器。

接着第四个任务,Deep research,我让 Coze 做了个对于我目前比较关注的无人机方面公司的研究:

以一个专业分析师的身份帮我分析下零零科技,生成交互式网页

结果咋说呢,还算满意,从公司简介、发展历程、产品介绍方面大体介绍了下,还从 SWOT 的角度分析了下优劣势。思路上是实习生的水平,数据嘛,一些特别详细的数值我是不敢信的,因为这家公司压根没有对外披露过,报告里也没有信源可供审查。

再来一个竞品分析吧:

请帮我对国内外睡眠监测 App 进行竞品分析,并同手表、毫米波雷达等硬件产品进行比较

结果,emm… 属于我不会招的实习生的水平,先是把几个产品罗列了一遍,说了下主要功能,然后比较了下同手表、手环的差异,从用户体验、价格、功能维度简单对比,最后给了结论。

实在忍不住了,又想要优化下:

分析的不够全面:
1. 技术原理对比;
2. 基于技术原理的优劣势对比;
3. 主要面向人群区分;
4. 主要面向渠道;
5. 盈利模式;
6. 功能对比;
7. 定价对比;
总之是要横向拉齐的,用表格进行对比,而不只是罗列;

最后表格是生成了,勉强好一点,但颗粒度还是太粗。

总体而言,Deep Research 这块,Coze 空间似乎和秘塔搜索没有特别大的差距,整体并没有看出 Agent 相比普通的文本大模型有更大的优势。要说能用么,写个 PPT 忽悠下不懂行的是可以,真要用在实际业务中,那还是工业垃圾的水准。

最后,测一下自带的 MCP,我选的是语音合成:

https://www.eugenewei.com/blog/2023/7/6/how-to-blow-up-a-timeline 帮我制作一个交互式网站,支持粘贴网址,解析网址内容,转化为音频,并有时间轴字幕。上为一个网址内容,可以自己解析先测试下。

最开始我的需求是制作一个可以解析网页内容,生成音频并且有时间轴字幕的交互网页,结果我运行了五六次,每次都报 timeout ,我也没辙,这问题还是太难。

那么退而求其次,直接分析这篇文章,不生成网站:

https://www.eugenewei.com/imported-mt-blog 帮我读出这篇文章

音频很快生成,但我点开才发现,网页读取时先给文章做了总结,音频生成的是总结后的内容。但音色是挺好听,挺自然,中英文都不错,毕竟字节的 TTS 确实领先。

那么不要网页读取了,我直接上传了一个 markdown 文件,让它读出来,结果每次都是失败。又尝试几次,发现如果文本较短,那么音频合成使用无问题,过长就容易出错,一般 1000 字以上大概就凉了。

数据处理任务完成较好;历史任务成果可以留存,比如生成网页,修改前和修改后的 jsx 文件都可以读取;这也是我吐槽 Flowith 不具备的功能;状态显示清晰,对话框交互不卡顿(中间过程额外有侧边窗口显示)

缺点:没啥亮点,没有特别惊喜的地方,中规中矩,差强人意。

来源:人人都是产品经理

相关推荐