智能周报|Manus走红,主要功劳不是Manus团队的

360影视 国产动漫 2025-03-10 00:54 2

摘要:对于大部分人来说,Agent还是个陌生的词汇,它的英文翻译一般是「代理人」、「经纪人」,它主要指那些受到委托人信任,在一定权限内代表委托人执行任务的角色,在传统定义里这样的角色只能是人类。

撰文 | 新皮层小组

编辑 | 王杰夫

本周智能圈最热门的话题自然是AI agent智能体。

对于大部分人来说,Agent还是个陌生的词汇,它的英文翻译一般是「代理人」、「经纪人」,它主要指那些受到委托人信任,在一定权限内代表委托人执行任务的角色,在传统定义里这样的角色只能是人类。

但随着计算机技术的发展,Agent早就脱离了肉体凡胎,很多可以在终端或网络中负责协调任务、管理资源的程序也开始被称作Agent,但这些Agent还是基于固定的规则来行动,而想要让Agent不拘泥于固定规则,就需要人工智能技术的提升。

第一个提出基于大型语言模型(LLM)的Agent框架的人就是OpenAI前研究与安全副总裁翁荔(Lilian Weng),她在2023年的一篇博文中首次定义了AI Agent的三要素,分别是:

· 记忆(Memory):包括短期记忆(如上下文窗口)和长期记忆(如外部存储与检索);

· 规划(Planning):将复杂任务拆解为可执行的子步骤;

· 工具使用(Tool Use):调用外部工具完成任务。

而大语言模型将是这个AI Agent的大脑,拥有自主的分析和决策能力。从这以后,中文互联网开始逐渐将这种由AI驱动的Agent翻译成智能体。从去年下半年开始,智能体就逐渐成为AI圈的热门话题。

先是在10月,OpenAI的最大竞对Anthropic推出了一个名为「计算机使用」(computer use)的新功能,这个功能让大模型可以代替用户操控电脑。之后国内AI创业公司智谱也推出了两个类似的智能体CogAgent与AutoGLM,前者代替用户操控计算机,后者操控网页和手机。

看着这些智能体为了买一杯咖啡在不同App之间比价、下单、结账,确实一度令人感到新奇,不过这种新奇感与看到一个婴儿首次站立行走并无区别,它只是长出了手和脚,但并不意味着它有了个好脑子。

而本周Manus的火爆,则主要归功于它智能上的提升,分析财报、制作表格、创建网页和简易游戏,这些工作都远远超出了点一杯咖啡的难度。这背后的关键变量就在于,过去半年推理模型取得了巨大突破。

最近几个月,一系列推理模型比如GPT o3、DeepSeek R1、QWQ、Claude 3.7 Sonnet等的发布甚至开源,一定程度上让基础模型降低了幻觉,提升了路径规划能力、深度研究能力和代码写作的准确率。而Manus走红,只是在合适的时机推出了一款可以彻底展现当前推理模型智能水平的综合智能体。

以下内容由「新皮层」团队制作,欢迎关注。

Key Points

新模型与产品

智能体产品Manus迅速走红,团队另一款产品Monica拥有数百万海外用户;

Google测试AI Mode以处理更复杂的查询;

通义千问开源推理模型QwQ-32B,数学能力不输DeepSeek-R1;

科技行业动向

苹果首款可折叠iPhone将在明后年上市,售价超2000美元;

滴滴自动驾驶寻求新一轮融资,估值50亿美元;

台积电拟在美投资1000亿美元,再建5个新工厂。

新模型与产品

智能体产品Manus迅速走红,团队另一款产品Monica拥有数百万海外用户

3月5日,一款智能体产品Manus在中文AI圈迅速走红。用户只需要告诉它最终目标,Manus就可以灵活调用各类工具,自主执行浏览网页、操作网页应用、编写并执行代码等操作来实现。在官网中,团队提供了Manus的多个用例,包括制定旅行攻略、保险政策比较分析、财报分析、制作课堂演示PPT、文档格式转换、生成小游戏等。

Manus的走红更多得益于在产品层面的打磨,而非底层模型能力的提升。例如在分析某款股票的工作中,Manus一来要调用金融API获取数据,二来要借助Python脚本生成可视化图表,这都需要产品团队提前布置好相应的工具。消息称,团队并未自研模型,而是调用Claude和Qwen等不同模型来执行多样的工作,目前Manus的单任务运行成本约为2美元。

使用Manus过程中,用户能感受到的体验感更多是computer use(电脑代操作类agent)的跨App操作能力及其可视化过程带来的,输出结果的可用性完全有赖于基础模型的能力。当然,最近几个月的一系列推理模型比如GPT o3、DeepSeek R1、QWQ、Claude 3.7 Sonnet等的发布甚至开源,以及Deep Research功能的商用,一定程度上让基础模型降低了幻觉,提升了路径规划能力、深度研究能力和代码写作的准确率。这些能力为财报分析、表格生成、网页和简易游戏的生成等更具生产力的agent提供了可能。Manus为这些能力提供了综合性的体验入口。

Manus团队主要成员包括创始人肖弘、产品合伙人张涛和首席科学家季逸超。该团队上一款AI产品Monica已积累用户数约400万,这是一款套壳类聊天助手。腾讯科技称,该公司目前共完成两轮融资,总规模超过1000万美元。

Google测试AI Mode功能以处理更复杂的搜索

3月5日,Google开始在搜索中测试一款名为「AI Mode」(AI模式)的新功能,它有点像是之前「AI Overviews」(AI概览)功能的升级版。AI Overviews可以在用户搜索时生成简洁的摘要总结并附上相关链接;但AI Mode更进一步,它基于Gemini 2.0开发,拥有制定计划、调用工具的能力。

官方称,AI Mode帮用户处理复杂问题,给出综合性回答,而不是罗列出一堆网页链接。例如用户问:「智能戒指、智能手表和追踪垫的睡眠追踪功能有什么区别」,AI Mode采用多步骤方法制定查询计划并搜索以查找信息,并根据找到的内容调整答案内容。如果想了解更多信息,用户可以提出后续问题,例如「深度睡眠期间心率会发生什么变化」,以便快速获得易于理解的答复以及相关链接。

通义千问开源推理模型QwQ-32B,数学能力不输DeepSeek-R1

3月6日,阿里巴巴开源了通义千问推理模型QwQ-32B。在数学能力和代码能力的测试评估中,QwQ-32B的表现与参数量约20倍的DeepSeek-R1相当,并超过o1-mini及相同尺寸的R1后续模型。

通义团队称,在冷启动基础上,QwQ-32B针对数学和编程任务、通用能力分别做了两轮大规模强化学习。在初始阶段,特别针对数学和编程任务进行了强化学习。在第一阶段的强化学习之后,研发人员还增加了另一个针对通用能力的强化学习。最终发现,通过少量步骤的通用强化学习,可以提升其他通用能力,同时在数学和编程任务上的性能没有显著下降。

此外,QwQ-32B模型还集成了与智能体Agent相关的能力,使其能够在使用工具的同时批判性思考,并根据环境反馈调整推理过程。目前,该模型已经在魔搭社区及Hugging Face开源。

科技行业动向

苹果首款可折叠iPhone将在明后年上市,售价超2000美元

3月6日,天风国际证券分析师郭明錤爆料,苹果初代可折叠iPhone将在2026年年底或2027年初上市,预计售价为2000至2500美元。

郭明錤认为,这款可折叠iPhone的定位为真正的AI手机,「多模态与跨App使用为未来AI装置的大趋势,故手机屏幕越大,越有利AI用户体验。例如,与聊天机器人讨论旅游行程时,同时呈现完整的地图App。」

初代可折叠iPhone将采用「书本式」左右折设计。展开手机时,屏幕尺寸约7.8英寸,厚度约4.5-4.8毫米;折叠手机时,屏幕尺寸约5.5英寸,厚度约9-9.6毫米。打开与折叠时各有一个前置相机,后置相机为双镜头。另外,指纹识别功能(Touch ID)将回归,但会被集成在设备的侧边按键上,因厚度与空间限制,预期没有面部识别功能(Face ID)。

郭明錤称,因生产难度非常高,初代可折叠iPhone预计于2026年第四季度量产,放量可能要等到2027年,2026年出货量预计为300万至500万部。第2代可折叠iPhone预计在2027年下半年量产。

滴滴自动驾驶寻求新一轮融资,估值50亿美元

3月4日,有报道称,滴滴自动驾驶公司正在寻求新一轮融资,完成后估值可能达到50亿美元。滴滴目前正与潜在投资者谈判,其中包括一家北京基金。知情人士称,滴滴会用这笔资金继续开发自动驾驶技术,并加快无人驾驶出租车(Robotaxi)的量产。

滴滴于2016年组建自动驾驶技术研发团队,2019年8月宣布旗下自动驾驶部门升级为独立公司, 专注于自动驾驶研发、产品应用及相关业务拓展,团队规模超200人,时任滴滴CTO张博兼任新公司CEO。2024年11月,张博卸任滴滴CTO,专注自动驾驶业务。

2020年6月,滴滴首次向公众开放自动驾驶服务。2023年4月,滴滴推出其首款自动驾驶概念车「DiDi Neuron」。目前,滴滴自动驾驶部门运营由200多辆汽车组成的自动驾驶车队,已在北京、广州和上海等城市测试。

此前,滴滴自动驾驶已完成多轮融资:

· 2020年5月,获得首轮超5亿美元融资,由软银愿景基金2期领投;

· 2021年1月,获得3亿美元融资,投资方包括IDG资本、CPE、Paulson、中俄投资基金、国泰君安国际、建银国际等;

· 2021年5月,超3亿美元战略融资,投资方为广汽集团;

· 2023年10月,获得1.49亿美元融资,投资方为广汽资本和广州开发区投资集团;

· 2024年10月,获得2.98亿美元融资,由广汽集团领投,滴滴参与。

台积电拟在美投资1000亿美元,再建5个新工厂

3月3日,美国总统特朗普和台积电董事长魏哲家在白宫会面,随后共同宣布该公司将在美国再投资1000亿美元,成为美国史上规模最大的单项外来直接投资案。台积电表示,这笔资金将用于未来数年建造3座半导体厂、2座先进封装厂和一座研发中心。此外,台积电并没有透露任何新投资的时间表,仅表示在未来4年内会在美国增加4万个岗位。

这笔新资金使台积电在美国的总投资达到了1650亿美元。2020年,台积电在美国亚利桑那州凤凰城投资120亿美元建设了第一座5纳米晶圆厂。随后,在2023年芯片法案推动下,台积电宣布扩建第二座晶圆厂,总投资额增至400亿美元。2024年4月,台积电宣布在凤凰城再建第三座晶圆厂用于生产2纳米或更先进制程芯片,总投资额提升至650亿美元,预计2030年前投产。

半个月前,市场传闻称,台积电和博通可能联合收购英特尔。台积电3月3日宣布的1000亿美元投资计划意味着对英特尔的收购可能不会变成现实。

来源:第一财经YiMagazine

相关推荐