全球首个AI代理Manus,海外第一波评论来了:第二个DeepSeek时刻!

360影视 国产动漫 2025-03-10 11:48 2

摘要:上周,Manus横空出世,以全球首款通用AI Agent在国内社交媒体上刷频。但爆火同时也被质疑存在过度营销之嫌,其中一大质疑是,Manus的"爆火"主要局限于国内,在海外却无人问津。

Manus终于火到海外了。

上周,Manus横空出世,以全球首款通用AI Agent在国内社交媒体上刷频。但爆火同时也被质疑存在过度营销之嫌,其中一大质疑是,Manus的"爆火"主要局限于国内,在海外却无人问津。

而这个周末,Manus开始破圈了,福布斯等主流媒体开始关注,也成为海外科技博主热议话题,一众科技大佬纷纷展开测评,有媒体称热度甚至赶超流行音乐女王霉霉的演唱会。

热议之下,Manus获得不少好评。比如知名AI博主Rowan Cheung称之为中国的“第二个DeepSeek时刻”,Hugging Face的产品负责人称Manus是他尝试过的“最令人印象深刻的AI工具”。

不过,也有用户在测试中发现体验并不顺畅而持保留态度。

世界上第一个完全自主的AI代理

3月8日,福布斯文章称,Manus这个来自中国的AI代理正在改变一切。

福布斯称Manus是一个能够独立思考和行动的革命性AI代理,重新点燃了一个已经持续了几十年的辩论:当人工智能不再寻求许可,而是开始自己做决定时,会发生什么?

在福布斯看来,Manus不仅仅是一个聊天机器人,也不是一个披着未来主义品牌的改进搜索引擎。它是世界上第一个完全自主的AI代理:

一个不仅仅协助人类的系统——它取代了人类。从分析金融交易到筛选求职者,Manus在数字世界中无需监督地导航,以一种即使是经验最丰富的专业人士也难以匹敌的速度和精确度做出决策。本质上,它是一个数字通才,被训练来管理跨行业的任务,而没有人类犹豫不决的低效。

第二个DeepSeek时刻

知名AI博主、曾专访扎克伯格并率先发布Llama-3开源消息的Rowan Cheung转发了Manus的官方视频,并将Manus比作“中国的第二个DeepSeek时刻”,并预测其进入美国市场只是时间问题。

这是Rowan首次发文讨论Manus。目前,这条推文评论接近600条,浏览量超260万。

Rowan在评论里介绍了自己的体验经过。在收到邀请码后,他先测试了Manus创建个人传记并基于此传记部署网站的能力。Manus通过他的社交渠道、浏览文章,并成功部署了网站,且信息100%准确,包括最新的信息。

接下来,Rowan测试了Manus在提供实用信息方面的表现,例如寻找旧金山最佳租车地点,要求满足低犯罪率、大量人工智能活动和高密度的雄心勃勃的年轻企业家。Manus提供了4个非常准确的选项。

Rowan进一步测试了Manus完成长时间研究任务的能力,要求它创建一门关于内容创作人工智能的完整课程。Manus花了近2个小时完成,最终提供了一门包含8章的课程,其中包含工具、用例和提示示例。

一番体验下来,Rowan认为Manus“并不全是炒作”。

专注于搜索引擎优化(SEO)的X用户Julian Goldie直言,在看到Manus的实际效果后,他取消了每月200美元的ChatGPT订阅,他认为Manus正在重新定义浏览器自动化的功能。

经过测试,Goldie总结了Manus的强大功能:能够同时控制50个浏览器、实时创建和编辑文件、部署功能齐全的网站……

不仅如此,Goldie认为Manus在效率提升和成本节约上都能“秒杀”竞争对手,不仅在研究方面比任何竞争对手都更快,能够快速生成综合报告和可视化效果,而且使用Manus可以节省数千美元。

Hugging Face的产品负责人Victor M测试了Manus的代码生成功能,展示了Manus编写的一个使用Three.js库控制飞机的游戏。

Victor M大为惊叹,称他尝试过的“最令人印象深刻的人工智能工具”。他表示,Manus的用户体验(UX)是许多其他工具承诺过的,但Manus真正实现了。

X用户Umar Jamil分享了使用了Manus 来帮他在伦敦找房子的过程,他对Manus推荐的社区非常满意,并且很快就要搬过去了。

Umar Jamil的需求是在伦敦找到一个公寓,要求通勤时间不超过一小时,租金不超过1750英镑,至少有一间卧室和一个大客厅。

Manus 花了大约10分钟内完成了研究任务,通过创建一个待办事项列表来构建研究计划,并将所有中间结果保存在文件中,随着找到更多信息不断编辑这些文件。它会浏览互联网,寻找所有与研究相关的有用信息。

最后,Manus 推荐了几个区域,并推荐Walthamstow Central为最佳选择,因为它通勤时间仅为17分钟,租金在1300至1700英镑之间,且在预算内有较大的居住空间。

找到满意房子后,Umar Jamil连发数条推文表达他的震撼,称Manus ~= Claude + MCP*1000 + Deep Research+ Operator,还发问:“马拉多纳是‘上帝之手’,Manus会是‘AGI之手’吗?”

耗时太长、信息不准...吐槽也不少

Manus在海外的快速崛起也伴随着争议,一些用户和专家对其技术成熟度提出质疑,也有一些早期用户表示体验Manus的过程并不顺畅,而且存在一些事实性错误。

AI初创公司Pleias的联合创始人Alexander Doria在测试Manus时遇到了错误信息和无限循环的问题。

Jackson Laboratory 教授Derya Unutmaz对比了OpenAI的Deep Research和Manus的性能。

Deep Research在不到15分钟内完成了任务,而Manus AI在运行50分钟后,在步骤18/20时失败了。

Unutma观察了Manus AI的输出,认为其表现相当好,并进行了第二次尝试。但第二次尝试在20分钟后,在步骤9/20时也失败了,Unutma推测可能是Manus AI的服务器过载。

也有用户指出,Manus在事实性问题上会犯错误,并且并不总是引用其工作来源,有时会遗漏很容易在网上找到的信息。

X用户Teortaxes认为Manus是一个针对社交媒体影响者极度优化的产品,这解释了它为何如此受欢迎:

该产品在生成主题内容、旅行计划等一般兴趣方面表现良好,但在STEM领域协助和编程方面表现不佳,甚至不如使用谷歌搜索。

Teortaxes提到Manus AI在处理某些任务时的输出质量不高,与将文档直接输入ChatGPT/Gemini相比没有太大优势,称之为“相当标准的GPT废话”。

TechCrunch记者Kyle Wiggers自己对Manus的体验也不太好。

他让Manus处理一个看似简单的请求:从他所在地区的顶级快餐店订购一份炸鸡三明治。大约十分钟后,Manus崩溃了。在第二次尝试中,Manus找到了符合他标准的菜单项,但无法完成订购过程,甚至无法提供结账链接。

Wiggers还让Manus预订从纽约到日本的航班,但Manus只能提供几个航空网站和像Kayak这样的机票搜索引擎的链接,其中一些链接是无效的。此外,Manus在尝试预订附近餐厅的座位和构建一个以《火影忍者》为灵感的格斗游戏时也失败了。

Manus的双重颠覆:加强中国AI叙事,重定义智能边界

无论如何,Manus的横空出世为AI发展带来了双重突破。一方面,Manus进一步加强了中国AI的叙事。多年来,全球AI叙事一直围绕着OpenAI、谷歌、Meta等美国科技巨头展开。而Manus继DeepSeek之后,再次证明了中国在AI领域的实力。

另一方面,Manus颠覆了AI发展的既定路径。过去,业界普遍认为谁能打造出更强大的语言模型、更复杂的聊天机器人,谁就能主宰AI的未来。而Manus的出现打破了这一路径——它不仅仅是对现有AI的迭代升级,而是开创了一个全新的智能范式:从被动响应指令到主动规划行动,从聊天机器人到自主代理,Manus或许正是AGI破茧而出的第一道曙光。

来源:华尔街见闻

相关推荐