Manus掀起Agent风暴 你的全能助理来了|产业科技周报

360影视 欧美动漫 2025-03-13 20:04 2

摘要:当其他AI还在和你讨论“如何做PPT”时,Manus已经默默打开了你的电脑,从解压文件、筛选简历到生成分析报告一气呵成——这个由国内团队打造的智能体,重新定义了AI助手的天花板。

【亿邦原创】本周主角属于Manus,也属于AI Agent。

当其他AI还在和你讨论“如何做PPT”时,Manus已经默默打开了你的电脑,从解压文件、筛选简历到生成分析报告一气呵成——这个由国内团队打造的智能体,重新定义了AI助手的天花板。

正当Manus出道即顶流时,更多Agent正在赶来的路上:Manus上线当晚,MetaGPT团队当天甩出开源复刻版OpenManus,实现24小时造平替。国内社区CAMEL-AI.org也火速上线复刻版OWL项目,号称要“刷爆原版”。OpenAI放出Agent全家桶,可盐可甜就是有点贵;国产首款创作型Agent上线,可以轻松创作互动小说。

在Agent的流量旋涡外,另一场风暴正在酝酿:OpenAI发布大模型监控工具,即通过CoT(思维链)监控方式,阻止大模型胡说八道、隐藏真实意图等恶意行为,同时也是监督超级模型的有效工具之一。Meta首席科学家杨立昆更预言,我们距离AGI只剩“三大关”,他还反驳了AI发展因数据耗尽而终结的观点,认为训练AI模型的全球资源远没有到尽头,AI发展仍将继续。

3月13日,Manus官网账号宣布,7天来,Manus使用申请等候名单增加到200万人。

业内人士评价:人们往往更喜欢某种事物的想法,而不是事物本身。真正的考验将是把这种等待名单的兴奋转化为活跃且留存的用户。好的产品让人兴奋;伟大的产品能让人长期留存。

1、Manus:出道即“顶流”

2025年3月6日凌晨,一款名为Manus的AI Agent产品空降热搜。官方视频里,它可以解压简历文件、分析股票走势、生成PPT,甚至能替用户在日本旅行时定制“二次元打卡路线”。上线不到12小时,Manus官网被挤崩,官方账号因“加密货币诈骗”乌龙被平台封禁。

上线当晚,Manus就经历了一场“塌房危机”。产品上线后,自媒体用“炸裂”“国产之光”等标题刷屏,创始人“天才少年”人设加持,邀请码被黄牛炒至10万元。此外,Manus营销也被质疑延续了概念炒作的套路:资本催熟、媒体造神、用户跟风。

尽管争议重重,Manus让大众看到AI Agent工程化落地的可能性,其“过程可视化”设计(如展示AI操作浏览器的思考路径)或成未来交互范本。

2、Manus复现潮:复刻核心系统仅用了1小时

从Manus出道即巅峰,到开源社区复现Manus,这中间的时间差是:0天。

在Manus爆火当天,一个5个团队在3个内就作出一个完全免费、无需排队等待的复制版:OpenManus。该产品一上线GitHub,不到24小时便斩获7000多颗星,被戏称为“AI界的拼多多速度”。OpenManus背后的团队是MetaGPT团队,团队核心成员洪思睿等人曾发表多篇顶级论文,在2023年就开源了多智能体框架,能模拟公司运作流程,让AI像人类员工一样分工协作。面对Manus的挑战,他们迅速将框架“改装”成复刻版,甚至优化了任务拆解的逻辑,号称“比原版更合理”。

此外,CAMEL-AI.org社区也火速上线OWL项目。创始人李国豪认为,复现Manus对他们而言“像搭积木”——社区内早已储备了浏览网页、编写代码等基础Agent工具,只需“串联一下”就能快速成型。更硬核的是,OWL在GAIA基准测试中拿下了58.18分,直接向Manus的“SOTA”(业内最优)成绩发起挑战,甚至放话要“刷爆原版”。

Manus复现潮折射出中国AI生态的两面性。一个是“快”:技术迭代速度惊人,从创意到产品化仅需数日,印证了“天下武功唯快不破”。一个是“慢”:基础技术仍依赖海外。例如,Manus复现项目普遍采用Claude3.5、Qwen等模型,核心框架也多借鉴国外开源成果。

3、Open AI发布智能体全家桶

3月12日,OpenAl发布Agent(智能体)工具包,包括:Responses API,一种API接口工具;开源框架Agents SDK,内置工具包括Web Search Tool、File Search Tool和 Computer Use Tool。OpenAI通过API支持Operator的CUA模型,让开发者构建自己的智能体。C端用户可以订阅ChatGPT的Pro会员(200美元/月)、Team或Enterprise计划来使用。

OpenAl称在过去的一年里,引入了新的模型功能,例如高级推理、多模态交互和新的安全技术,这些功能为模型处理构建智能体所需的复杂、多步骤任务奠定了基础。但是,客户表示,将这些功能转化为生产就绪的Agent可能具有挑战性,通常需要大量的提示迭代和自定义编排逻辑,而没有足够的可见性或内置支持。

4、微软开源多模态AI基础模型,轻松拿捏网页、机器人

3月10日,微软研究院官宣开源多模态AI——Magma模型。据介绍,这是首个能在所处环境中理解多模态输入并将其与实际情况相联系的基础模型。只要给定一个目标描述,Magma就能制定计划、执行行动,无论是在数字界面中还是物理世界里,都能展现出灵活而高效的交互能力。比如在真实机器人任务中,让机器人移动桌面上的“热狗”模型、把蘑菇模型放到锅里,或者将抹布从左至右推开。目前该模型以MIT许可证在GitHub上开源。

5、OpenAI发布CoT监控,阻止大模型恶意行为

北京时间3月11日凌晨1点,OpenAI发布了最新研究,用CoT(思维链)监控的方式,可以阻止大模型胡说八道、隐藏真实意图等恶意行为,同时也是监督超级模型的有效工具之一。

CoT监控的核心就是通过观察模型的“思维过程”来检测其潜在的恶意行为。OpenAI使用了最新发布的前沿模型o3-mini作为被监控对象,并以较弱的GPT-4o模型作为监控器。测试环境为编码任务,要求AI在代码库中实现功能以通过单元测试。结果显示,CoT监控器在检测系统性“奖励黑客”行为时表现卓越,召回率高达95%,远超仅监控行为的60%。

6、字节提出SeedFoley模型,端到端架构实现视频音效生成

字节跳动豆包大模型语音团队最新提出的SeedFoley模型,通过端到端架构实现了视频音效的智能生成,通过融合时空视频特征与扩散生成模型,实现了音效和视频的高度同步。AI音效已在即梦上线,用户使用即梦生成视频后,选择AI音效功能,可生成3 个专业级音效方案。

7、国产首款创作型Agent上线,轻松创作互动小说

3月12日,一款名为“谜境Agent”的国产AI创作工具,主要应用于互动小说创作领域。传统的互动小说创作往往需要剧本编剧、画师和开发者等多方协作,耗时长达4-6个月。而“谜境Agent”通过AI功能,将这一过程压缩至仅需5-10分钟,极大地简化了创作流程。

谜境Agent的功能包括:快速生成剧本大纲——自动生成人物设定和角色关系图——自动生成分镜和场景图——自动配音配乐——多样化的互动设计——支持随时一键修改内容。

8、字节AI“大将”,加盟生数科技

3月12日,原字节跳动AI大将、火山引擎高管骆怡航于近日加入生数科技,担任CEO一职,全面负责公司研发、产品、商业化及团队管理工作。

骆怡航博士毕业于清华大学自动化系,此前担任字节跳动火山引擎AI应用产品线一号位,汇报火山引擎总裁,全权负责产品线的战略、产品和商业化。生数科技主攻多模态大模型,创始人朱军是清华大学计算机系教授,清华大学人工智能研究院副院长。2025年1月,生数科技发布Vidu 2.0,视频生成速度突破10秒以内,成本降至不到行业平均水平的一半,推动视频生成走向人人可用。

骆怡航的加入,意味着AI视频生成赛道已到了技术成熟和商业化落地的关键时刻。另据了解,生数科技此前已引入商业化副总裁王川、品牌市场负责人刘婷婷,全新的团队配置为加速商业化补充了弹药。

9、又一国资向智谱投了5亿元

3月13日,《珠海网》报道,珠海华发集团宣布战略投资北京智谱华章科技有限公司(以下简称“智谱”) ,金额为5亿元人民币,以推进智谱基座GLM大模型的技术创新与生态发展。

珠海高新区、华发集团和智谱签署合作协议,正式宣布联合智谱搭建首个城市级GLM大模型空间 —— “智谱 + 珠海华发空间”。依托珠海的产业和算力基础、以及智谱全自研GLM基座大模型和成熟的MaaS(Model as a Service)开放平台,“智谱 + 珠海华发空间”将为珠海产业提供从技术层、平台层到应用层的全栈AI技术支持,创新高密度产业集群AI生态区的模式,加速珠海打造人工智能产业高地。

就在10天前的3月3日,智谱刚宣布完成10亿元人民币的战略融资,参与投资方包括杭州城投产业基金、上城资本等。

10、杨立昆最新万字访谈:我们距AGI只剩“三大关”

近日,Meta首席AI科学家杨立昆接受海外播客This Is IT的专访,探讨了深度学习的发展历程、机器学习的三种范式、莫拉维克悖论与AI发展的限制、训练AI模型的资源、AI基础设施投资等话题。

杨立昆指出了当前AI发展的3个关键限制:物理世界比语言复杂,莫拉维克悖论(计算机可以下棋、解决数学难题,但无法完成简单的物理任务),感官信息量远大于语言。他认为,缺少训练系统理解复杂感官数据(如视觉)的能力是当前AI发展的最为关键的限制。他还反驳了AI发展因数据耗尽而终结的观点,认为训练AI模型的全球资源远没有到尽头,AI发展仍将继续。

来源:亿邦动力

相关推荐