智能周报|Agent概念大爆发,但用于构建Agent的工具多于实际开发出来的Agent

360影视 日韩动漫 2025-05-26 06:34 2

摘要:连续好几周,我们都在周报中讨论了Agent。一方面,每家人工智能公司都提到了它,过去一周,这种热度仍在继续,国内的腾讯、MiniMax,国外的Anthropic、微软、Google,几乎每家公司开发布会时都会声称自己的业务或产品与Agent有关。但另一方面,真

连续好几周,我们都在周报中讨论了Agent。一方面,每家人工智能公司都提到了它,过去一周,这种热度仍在继续,国内的腾讯、MiniMax,国外的Anthropic、微软、Google,几乎每家公司开发布会时都会声称自己的业务或产品与Agent有关。但另一方面,真正定义明确的Agent并不多。

这种不明确不是来自于Agent的定义本身,如同我们在之前几周的周报中所说,当模型预训练的边际效益几乎消失、模型能力几乎达到天花板,预训练模型本身做不到的事情,可以通过基于强化学习的后训练,让模型学会在特定领域调用特定工具,从而完成一些非标任务。产品形态上,Agent是对话式的,而传统应用程序有一系列的固定菜单,用户需要逐层点选才能完成设定好的任务。一个自由,一个固定。基础模型难以再取得突破性进展时,这种后训练出来的Agent可以在特定领域具备超越于基础模型本身的能力。

以上关于Agent的定义已经取得越来越多公司的共识。问题在于,知道如何构建Agent与构建出实际可用的Agent是两回事。

仔细看的话,过去这段时间以来各大公司发布的与Agent有关的产品都是平台——从字节跳动的「扣子空间」到腾讯的「腾讯云智能体开发平台」,从微软的「Open Agentic Web」到Anthropic的新模型Claude 4,都是在为开发Agent的开发者提供开发工具或基础设施。

有想法、在某一细分领域能力比基础模型强的Agent目前还不多。

以下内容由「新皮层」团队制作,欢迎关注。

Key Points

模型与应用

LovartAI发布设计Agent;

MiniMax上线Agent平台;

QQ浏览器变身AI浏览器,还推出了一个通用Agent——QBot;

Claude 4发布,自称适用于构建Agent;

微软要建「Agent互联网」,还想用Agent革程序员的命;

硬件

小米发布3nm制程SoC芯片玄戒O1;

OpenAI收购IO公司,计划发布AI陪伴设备;

苹果计划2026年发布智能眼镜。

模型与应用

LovartAI发布设计Agent

5月13日,LiblibAI的海外团队Lovart发布了一个设计领域的Agent LovartAI,支持用户通过对话生成标志、海报、广告、品牌套件等多种设计素材,以及手动修改画布内的内容。Lovart发布的演示视频显示,该平台集成了多种AI模型,包括GPT4o、Stable Diffusion、Flux,以及各类设计软件,包括Photoshop和Figma等,用户可以导入和导出多种兼容格式。目前,用户需要通过邀请码或官网申请排队才可以体验LovartAI。LibLibAI由字节剪映原商业化负责人陈冕于2023年5月创立,专注于AI+设计领域。

MiniMax上线Agent平台

5月17日,MiniMax宣布上线其Agent平台。该平台提供「标准」和「深度」两种模式,支持任务拆解、链式推理、实时进程可视化等功能,适用于文档核查、网页生成、旅游规划等多种应用场景。目前,平台内的Agent处于内测阶段。这些Agent基于MiniMax此前发布的MiniMax-01系列模型,支持最长400万tokens的上下文处理能力。

QQ浏览器变身AI浏览器,还推出了一个通用Agent——QBot

5月19日,腾讯官宣在QQ浏览器上线AI助理Qbot,这是继ima之后腾讯推出的另一AI入口。腾讯称,Qbot力图将浏览器「从上网入口变成AI工具箱」。目前,QQ浏览器的PC和手机双端升级均已完成。Qbot集成了腾讯混元和DeepSeek两个模型,支持AI搜索、AI浏览、AI写作、AI学习、AI办公等五大功能,支持多模态搜索,同时提供文件格式转换、表格提取工具。此外,QBot还集合了多个Agent,首批上线了「AI高考通」「下载助理」「更新助理」「股票助理」等4个Agent,目前这些Agent还在灰度测试中。有报道称,QBot会与腾讯内部其他产品合作,成为类Manus的通用Agent。5月21日,腾讯云宣布将「大模型知识引擎」(基于大模型的应用构建平台)升级为「腾讯云智能体开发平台」,让每个企业端用户都可以开发出符合自己需求的Agent。

Claude 4发布,自称适用于构建Agent

5月22日,Anthropic在其首次开发者大会上发布Claude 4系列模型,包括Claude Opus 4与Claude Sonnet 4两款新模型。据官方介绍,这两款模型在软件开发、复杂推理和多步任务执行方面表现突出,适用于分析大规模数据集和构建Agent。其中,Opus 4被定位为Anthropic迄今为止性能最强的模型,在SWE-bench等编程能力评估中优于OpenAI和Google的同类产品,可持续执行数小时的长周期任务。而Sonnet 4作为Sonnet 3.7的直接替代品,提升了指令响应准确性与数学推理能力,并对免费用户开放。

微软要建「Agent互联网」,还想用Agent革程序员的命

5月19日至5月22日,微软举办Build 2025开发者大会,提出要构建一个「Open Agentic Web」(开放智能体网络)。在微软构想的Open Agentic Web中,Anthropic的MCP协议承担着类似于互联网中的HTTP协议的角色,这次发布会中,微软推出了一个名为NLWeb的开源项目,称其将在Open Agentic Web发挥与HTML类似的作用。除了编程类Agent,微软还推出了一个能在人类程序员下班时自主修复故障的Agent,目标是「未来用Agent(而非人类程序员)创建应用程序」。

硬件

小米发布3nm制程SoC芯片玄戒O1

5月22日,小米在15周年战略新品发布会上发布了首款自主研发的系统级芯片玄戒O1,并同步发布了搭载此芯片的小米15S Pro、小米平板7 Ultra、小米手表S4 15周年纪念版。雷军称,玄戒O1已开始量产。由此,小米成为继苹果、高通、联发科之后,全球第4家自主研发设计3nm制程手机处理器芯片的公司。玄戒O1采用了目前行业内最先进的第二代3nm制程,搭载190亿颗晶体管。小米对标的是行业顶尖苹果A18 Pro,称其处理速度大幅领先,且性能功耗比A18 Pro低35%。同时,通过小米自研的第四代图像处理器ISP,玄戒O1的处理速度最高可达每秒87亿像素,速度最高提升100%。

OpenAI收购IO公司,计划发布AI陪伴设备

5月21日,OpenAI宣布将以约65亿美元的价格收购苹果前iPhone设计师Jony Ive的AI设备初创公司IO。这笔交易将以全股票交易方式完成,而OpenAI去年年底就已经持有IO公司23%的股份,此次收购将实际支付约50亿美元用以收购剩余股权。目前,这笔交易正在等待监管部门的批准,预计将于今年夏天完成。与此同时,OpenAI首席执行官Sam Altman向员工预览了与Jony Ive合作开发的设备,并计划推出1亿个「AI伙伴」设备。报道称,该产品将能够感知用户的环境和生活,不会干扰用户,可以放置在口袋或书桌上。Altman预测,这些设备将在2026年年底实现出货。

苹果计划2026年发布智能眼镜

5月23日,有报道称,苹果正在加速开发智能眼镜,将在今年年底与海外供应商合作,开始规模化生产原型机并测试,计划最终于2026年年底前推出该产品。报道称,该产品最初代号为N50,后被纳入更广泛的项目N401。整体功能上,苹果智能眼镜与Meta的Ray-Bans和Google的Android XR眼镜类似,将配备摄像头、麦克风和扬声器,能够分析用户周围环境,并通过Siri语音助手接收用户指令。此外,该眼镜还将支持打电话、播放音乐、实时翻译和导航等功能。知情人士称,苹果的最终目标是推出一款AR眼镜,将于2026年推出的这款带有摄像头和麦克风的眼镜只是一种「过渡方案」。

来源:第一财经YiMagazine

相关推荐