从“一码难求”到被多方质疑 Manus过山车式走红的冷思考

360影视 欧美动漫 2025-03-12 09:04 2

摘要:Manus的惊艳之处,在于其只需要一个简单的指令,就能解决各类复杂多变的任务,不仅提供建议或答案,还能直接交付完整任务成果。譬如像开发团队发布的案例,其可以进行简历筛选、房产研究、股票分析等。

3月6日,一款名为Manus的国产AI智能体(AI Agent)产品横空出世,热度瞬间席卷全网,一度有超过当红大模型DeepSeek的势头。

Manus的惊艳之处,在于其只需要一个简单的指令,就能解决各类复杂多变的任务,不仅提供建议或答案,还能直接交付完整任务成果。譬如像开发团队发布的案例,其可以进行简历筛选、房产研究、股票分析等。

然而,这股Manus热潮仅仅持续了两三天,业内就传出不少质疑的声音。首先是业内热传其“体验邀请码一码难求,内测码二手交易价已经炒到了5万一个”,最后却发现可能是假新闻,之后是各类自媒体主播话题讨论、投资人急寻开发团队、资本市场热炒股价等诸多乱象。

最新消息则是Manus在实际测评中,部分运行效果不尽如人意,而Manus创始人季逸超在社交平台坦承,产品使用了基于阿里千问大模型(Qwen)的微调模型,这是承认“套壳”本质创新不足了,还是站在了巨擘阿里的“肩膀上”?

VCG供图

海内外热评Manus

3月6日凌晨,中国AI团队Monica.im发布了一款通用型AI智能体产品Manus,称其是一款通用型的智能体,有独立思考能力,能规划并执行复杂任务,并直接交付成果。

据该团队发布的演示视频,Manus可以自主完成筛选简历、房产研究、股票分析等任务,且用户可以看到这些任务完成的全流程。

Manus的能力不止于此,其团队介绍,个性化旅行规划、教育课程开发、保险政策比较、B2B供应商采购、财务报告分析、公司名单整理、在线商店运营分析……需要规划分析、执行总结的活,它几乎都能干。

团队还称Manus在GAIA基准测试中取得了SOTA(State Of The Art,即当前最好的)成绩,其性能超越OpenAI的同级别大模型。

在经过发布后头两天的行业热捧后,国内外的一些测评揭示了Manus的真实“工作表现”。

在知名科技自媒体阑夕的测评中,Manus被要求制作一个国家的极简编年史,需包含漫画表选和网页设计。尽管Manus的最终作品配色不佳,且因服务器宕机未能进一步修改,但整体效果仍可作为“人机协同的样板间”,无论用作课外教案还是作品预览,都具有极低的使用门槛。

在阑夕测评中,Manus也展现出局限性。当被要求制作使用原神角色图标的消消乐游戏时,它在尝试搜集素材时遭遇网盘登录阻碍,不得不向用户发出接管请求。在处理复杂任务时,Manus在细节方面还存在不足,比如屏幕适配问题需要更多人工指导。

自媒体MindCode在深入体验分析后认为,Manus让一般用户感到惊艳,主要是因为它营造了一种“真人干活感”。但这种惊艳主要针对普通用户,对于熟悉AI领域的人士而言,Manus的基础能力与已有产品如Devin相比并无革命性突破。

在海外,一些用户和专家对其技术成熟度提出质疑,也有一些早期用户表示体验Manus的过程并不顺畅,而且存在一些事实性错误。

如科技媒体TechCrunch记者Kyle Wiggers体验就不太好:在尝试让Manus从他所在地区的顶级快餐店订购一份炸鸡三明治时,第一次直接系统崩溃了,第二次尝试中,Manus找到了符合他标准的菜单项,但无法完成订购过程;让Manus预订从纽约到日本的航班,只能提供几个航空网站和像Kayak这样的机票搜索引擎的链接,其中一些链接是无效的。

“Manus是一个很好的产品,但并不是一项技术突破。”麻省理工学院博士秦增益认为,受限于预设流程和工具环境,Manus难以处理开放场景任务,比如无法控制PowerPoint制作幻灯片。

质疑与意义

从3月6日凌晨起,Manus以惊人速度霸占各大社交媒体热门话题榜单,官网的注册系统很快便因访问过载崩溃。而凡涉及Manus的话题,评论区都会很快演变为“求码”集散地,闲鱼上的Manus邀请码标价几十到上万不等,甚至有卖家声称持有“官方渠道”邀请码,售价5万元且拒不议价……

这样的“新闻”引发关注的同时,市场对于Manus的评价开始出现两极分化的趋势。在一部分人看来,Manus采用邀请内测的机制,存在“饥饿营销”的嫌疑。

迫于舆论压力,Manus团队合伙人张涛先后两次澄清“从未投入任何市场推广预算”“闲鱼等平台发布的邀请码为虚假信息”,采用邀请码机制是“服务器容量有限不得已而为之”。

一波未平一波又起。在Manus的官方宣传中,它被冠以“首个通用AI智能体”的称号,但其实在它之前,OpenAI Operator、Claude Computer Use,都已经在AI智能体领域进行了探索,并且部分已经进入实际应用阶段。

技术层面上,Manus并没有自研大模型,而是通过调用不同的基础大模型来实现其功能,这种做法在业界被称为“套壳”。因此,有业内人士直言,Manus的核心能力,如任务拆解其实与Devin、Cursor等现有产品相似,其创新更多体现在工程封装而非底层技术突破。

甚至Manus合伙人张涛都表示,“(Manus)真的非常简单,就是没有秘密,就是相信模型的力量。”目前,已有多个团队成功复刻Manus并开源,其中,MetaGPT的4人团队只用了1个小时就完成了Open Manus(Manus“平替”)的核心系统,整体也只用了3个小时。

除此之外,网络流传的消息指,Manus一次任务就需要消耗2美元,而类似于Manus的编程特化版Agent Devin的月订阅价格是500美元。

之所以这么贵是因为Token消耗问题,参考DeepSeek的API文档中给出的标准:1个英文字符约等于0.3个Token。1个中文字符约等于0.6个Token。如果是以DeepSeek-R1为基底的Agent,每百万Token输出的价格为2.19美元。单次命令响应的输出消耗在1000个Token左右(即回答一个难度适中的数学问题),而有科技博主推测Manus一次复杂任务就会消耗百万Token甚至更高。

有媒体就算力消耗问题询问了Manus团队,但暂未得到回应。有业内人士表达了对Manus算力成本的担忧,认为就Manus目前的状态,大规模商业化可能还比较遥远。

尽管如此,华源证券认为,“市场对Manus有分歧,但产业意义更大,终局是什么样、谁将最终跑出来尚未定论,但Manus的范式对各家都有启示,我们能看到更多、更好的产品出来,产业趋势的确定性或将提升。”

中泰证券在研报中表示,Manus或将标志着通用Agent商业化元年到来。Agent瞄准和替代的绝不仅是传统软件市场,而是以万亿美元计的服务市场。通过将服务转化为软件(Service-as-a-Software)的模式,Agent为代表的应用模式将创造远超传统软件的价值量。

■新快报记者 郑志辉

来源:新快报新闻

相关推荐