兼听则明 – 又一家外媒对manus的报道

360影视 国产动漫 2025-03-12 01:15 2

摘要:英国媒体The Register于2025 年 3 月 10 日星期一 // 06:16 UTC对Manus进行了报道,该报道对Manus的评价似乎偏负面,当然也可能是更客观。不管怎样,倾听各种不同的声音,对我们了解事实更有利。

英国媒体The Register于2025 年 3 月 10 日星期一 // 06:16 UTC对Manus进行了报道,该报道对Manus的评价似乎偏负面,当然也可能是更客观。不管怎样,倾听各种不同的声音,对我们了解事实更有利。

The Register 是全球领先的、值得信赖的在线企业技术新闻刊物,在全球拥有约 4000 万读者。其核心读者群位于美国、亚太地区和英国,以及来自加拿大、北欧、印度及其他地区。大部分的Register 读者是技术专业人士、IT 决策者、高管和软件开发人员——来自全球各地的技术专家、政府政策专家和其他各类技术人员。The Register内容涵盖硬件、软件、人工智能和云服务,以及关于太空、电子、科技文化和工程壮举等。

下面是该报道的全文翻译。

Manus 狂热来了:中国“通用人工智能代理”是本周的“人工智能的未来”和 OpenAI 杀手

Simon Sharwood 2025 年 3 月 10 日星期一 // 06:16 UTC

上周,一家名为 Monica.im 的初创公司发布了“Manus”,中国研究人员的人工智能实力再次成为热门话题。Manus 号称是一项“通用人工智能代理”服务,可能会改进西方公司提供的工具。

Manus 被拿来与 OpenAI 的 Deep Research 做比较,后者搜索在线服务以获取信息,这些信息被汇编成文档,OpenAI 声称这些文档可以在半小时内“创建一份研究分析师级别的综合报告”。另一个参考点是 Anthropic 的 Computer Use API 和 OpenAI 的 Operator Agents 等工具,它们都可以使用 Web 浏览器执行基本任务,例如填写表格和使用电子商务网站。

Manus 看起来可以做到所有这些,甚至更多——根据它自己的基准,速度可能也更快。一段发布视频展示了它以超快的速度完成三项工作:

l 在获取、打开和阅读工作申请后,推荐最适合工作的候选人,然后在散文文档中对候选人进行排名,然后在提示后将其推荐重新格式化为电子表格;

l 在用户提供预算、要求和期望位置的信息后,准备一份关于可用房产的报告。该报告包括可用房源,以及社区便利设施的信息;

l 对不同股票进行相关性分析,撰写带有结论的散文文档,并创建一个交互式网站,让用户探索从网络上抓取的数据。

Manus 提供熟悉的聊天机器人用户界面,即一个空文本字段,用于输入提示。早期测试人员将使用 Manus 的体验描述为类似于与坐在键盘前的人坐在一起,以极快的速度将模糊的指令转化为精确的输出。

该服务在“Manus 的计算机”中运行 - 它看起来像一个云 Ubuntu 工作站。发布视频指出,该服务“作为由几个不同模型驱动的多代理系统运行”,其中一些将于今年晚些时候开源。

该服务的演示显示工作站编写自己的命令,访问大量网站,然后提供文档和用于生成它的完整代码。

The Register 对一些结果并不满意。Manus 制作的一款马里奥风格平台游戏的演示版本很粗糙,而且崩溃了。一份为期两个月的“澳大利亚、新西兰、阿根廷(以及南美洲其他地区)和南极洲”之旅的行程表仅引用了 17 个输出来源,并暗示乘坐“豪华”航班的费用仅为廉价机票的两倍,而商务舱的费用几乎总是经济舱票价的三倍。

假期计划也未能提供承诺的完整可下载内容,并对在澳大利亚度过一个月提出了奇怪的建议:谁会在一个月内不去悉尼,而是在冬天去塔斯马尼亚,在最多需要三天时间的内陆地区度过一周?

我们已经看到了有关性能缓慢和输出不令人满意的报告。

但我们发现很多测试人员的体验更愉快,他们报告说该工具一次打开了 50 个浏览器窗口来获取数据,然后在一瞬间对其进行了分析。开发人员对其编码能力赞叹不已。

我们看到的很多评论都抓住了 Monica.im 使用的“通用人工智能代理”一词,并从那里跳出来将 Manus 描述为迈向通用人工智能的一步——能够以人类或超人技能执行任务的软件。

DeepSeek 2.0?DeepSigh,更像它

我们还看到很多评论认为 Manus 代表了性能的飞跃,就像中国初创公司 DeepSeek 所取得的一样,该公司创建了一个聊天机器人,产生了很好的结果,最初被认为需要的计算能力比竞争对手的服务要少得多。

这种假设引发了某种程度的恐慌,因为人们认为中国 AI 公司正在击败所有竞争对手,尽管有旨在防止这种情况发生的出口禁令。投资者在考虑云服务商计划在 AI 基础设施上投入巨额资金,以及这是否是不必要的,因此很难收回成本时,也感到担忧。

恐慌的两个原因最终都被揭穿,因为 DeepSeek 被发现安全性很差,被几个政府禁止,并且夸大了它只需要适度硬件的说法。它也有偏见:如果提示词会引导产生一些敏感负面评价的回答时,这个提示会产生出错。

云服务商告诉投资者不要害怕,因为他们正在构建推理基础设施,并预计这将成为未来几个月和几年几乎所有应用程序的一部分(并且正在提高依赖它的应用程序的价格)。 The Register 已申请仅限邀请的服务帐户,并希望获得批准,以便我们能够在未来几天提供实际评估。

来源:阳光照耀我思想

相关推荐