摘要:5月19日至5月22日,微软在西雅图举办了为期4天的Build 2025开发者大会。2024年,微软在Build大会上提到最多的关键词还是「Copilot」(辅助驾驶员),而今年, 「Agent」(智能体)成为贯穿整场大会的关键概念。
Key Points
微软认为,Agent既需要会使用互联网,相互之间也要能交互;
Anthropic建立了Agent互联网的HTTP协议,微软要建立相应的HTML语言——NLWeb;
除了编程类Agent,微软还推出了一个能在人类程序员下班时自主修复故障的Agent;
纳德拉的目标是「未来用Agent(而非人类程序员)创建应用程序」;
微软强调帮助企业客户创建Agent,Google的目标是开发一款通用的个人助理。
5月19日至5月22日,微软在西雅图举办了为期4天的Build 2025开发者大会。2024年,微软在Build大会上提到最多的关键词还是「Copilot」(辅助驾驶员),而今年, 「Agent」(智能体)成为贯穿整场大会的关键概念。
在发布会的开头,CEO萨蒂亚·纳德拉就提出,微软要构建一个「Open Agentic Web」(开放智能体网络)。之后,微软的每一项新发布,从面向开发者的工具,到管理、整合工具的平台,几乎都和Agent有关。
在过去的15年里,微软的主要收入来自向企业销售云计算服务。而借助Agent,微软希望讲一个新故事,通过建立Agent工厂,找到一个串起旗下GitHub、Copilot、Azure AI Foundry和Azure等工具的新模式。
纳德拉带领下的微软正在转型, 从「软件即服务」(SaaS)模式转变为「服务即软件」模式 一一用Agent重构一切,包括为客户开发应用程序的程序员。
Agent既需要会使用互联网,相互之间也要能交互
最近各大厂在扎堆推出Agent产品,不过目前对于Agent并没有统一的定义。微软CTO凯文·斯科特称, 微软将Agent定义为人类可委派任务的对象 ,未来Agent可以帮人类完成的任务复杂度将不断提高。微软过去几年开发的各类AI组件、协议和服务,可以成为构建Agentic Web(智能体互联网)的基础。
在微软构想的Open Agentic Web中,最上层是目前已有的各个独立的Agent,比如微软的Copilot,OpenAI的ChatGPT也是一个独立的Agent。下方的运行层(runtime layer)部分,主要包括记忆(memory)、权限(entitlements)、行为(actions)和推理(reasoning)几方面的能力,这也是微软正在构建的组件,微软将这类组件打包放在Azure AI Foundry(围微软云服务的AI工厂)中交付。斯科特称,目前这些基础设施中的推理组件已经具备了很强的能力,但记忆能力的发展相对滞后。而记忆能力恰恰是使Agent能够接近真人协作者的关键因素。
Agent要完成复杂任务,必须具有和外部的互联网服务、其他Agent交互的能力。这种交互通过MCP或A2A等协议实现。MCP是由Anthropic于去年年底推出的开源标准,常被称为「AI应用的USB-C端口」。和USB-C将众多厂商的设备连接到各种外设一样,开发者可以使用MCP快速让他们的Agent与其他应用、Web服务等连接。 微软在这次发布会中宣布「拥抱MCP协议」。
Anthropic建立了Agent互联网的HTTP协议,微软要建立相应的HTML语言
在微软构想的Open Agentic Web中,MCP协议承担着类似于互联网中的HTTP协议的角色。此外, 微软还在这次发布会中推出了一个名为NLWeb的开源项目,称其将在Open Agentic Web发挥与HTML类似的作用。
HTTP是一种网络协议,用于在客户端和服务器之间传输数据,而HTML是一种标记语言,用于定义网页的结构和内容,两者在网页的访问和呈现过程中相互协作。
微软称,NLWeb能快速将网站或API变成AI应用,它允许网站为用户提供一个类似ChatGPT的对话界面,用户能通过自然语言直接与网站交互。而且,由于NLWeb已经与MCP打通,每个NLWeb的端点都默认是一个MCP服务器,可以被其他人发现和访问。
对于网站或应用来说,NLWeb可为其提供ChatGPT级别的搜索功能。 比如,接入NLWeb后,电商平台可以通过问答,帮助推荐特定场景下适用的产品;烹饪网站也可以为用户推荐个性化食谱。NLWeb的项目负责人拉马纳坦·古哈(Ramanathan V. Guha)称,用自然语言与应用程序及计算机交流是新的网络革命。他声称:「我们正处于第4次革命的中期,前3次革命分别是图形用户界面(GUI)、互联网和移动设备。」
古哈称,当前大多数满足以上条件的交互已被ChatGPT、Claude等产品垄断,NLWeb希望让所有网站或应用程序都可以拥有自然语言交互功能。 与传统搜索引擎相比,NLWeb模式使得搜索的成本大大降低。 网站所有者不再需要爬取网页并创建包含所有内容的索引,只需要获取一个RSS源,把它放到一个矢量数据库中,再配合一个不需要太昂贵的大模型,就可以运行搜索功能。
目前,微软正在与TripAdvisor、Eventbrite和Shopify等公司合作,将这种交互直接融入它们的网站。不过,NLWeb可能是一项来自OpenAI的技术。去年11月,有消息称OpenAI在与康泰纳仕等公司合作开发NLWeb的早期版本。当时,OpenAI称这项技术可以帮助其合作伙伴为自己的网站引入类似ChatGPT的对话功能。
除了编程类Agent,微软还推出了一个能在人类程序员下班时自主修复故障的Agent
在GitHub Copilot之后,微软在此次开发者大会上发布了面向开发者的编程类Agent——GitHub Copilot coding Agent,这个Agent直接被集成到了GitHub中。纳德拉称,这次升级后,GitHub Copilot不再仅仅是一个编辑器内的助手,而将发展成为一个能够与开发者协作的AI同事, 从「结对编程」演变为「同伴编程」。
除了GitHub,其他公司也推出过自己的AI代码Agent。Google于去年12月发布了「Jules」,OpenAI则在5月16日发布了「Codex」。不过,此前的不少AI代码工具,比如Cursor、Trae等属于本地代码编辑工具,在写完代码之后,程序员需自主完成上传等任务。
本次更新之后,微软的Coding Agent将被整合到GitHub的主流程里,使得「写代码」和「代码协作」两个流程实现深度融合和打通。开发者只需在GitHub平台上分配任务,Agent就可以帮助开发人员完成修复错误、开发新功能、重构代码、编写文档、执行测试以及协助代码调试等众多任务,程序员只需要最后验收检查即可。
深夜电话是很多开发人员的痛处。 微软此次还宣布推出「Azure SRE Agent」,帮助开发者处理生产环境中的故障。 该Agent能自动响应生产警报、自主排障、定位并解决根本问题,将问题解决时间从数小时大幅缩短至几分钟。
纳德拉的目标是「未来用Agent(而非人类程序员)创建应用程序」
今年1月,微软宣布合并其AI平台部门与开发者部门,组建一个专注于AI的新团队——CoreAI(平台与工具)部门。该团队由去年10月加入微软的杰·帕里克(Jay Parikh)领导。加入微软前,帕里克在Meta担任工程主管。
纳德拉希望在微软内部推动改革,目的是「未来能够用Agent创建应用程序」。 也就是说,微软希望曾经需要由程序员完成的任务,未来由Agent完成。看起来,纳德拉希望微软从一家以「软件即服务」(SaaS)为主要模式的公司转变为「服务即软件」模式。帕里克在接受采访时称,纳德拉希望 微软彻底改革开发软件的方式,为客户建造一个「Agent工厂」。
在云端,微软于去年11月推出了一站式AI开发平台Azure AI Foundry,供开发者设计、定制和管理AI应用程序和Agent。这次发布会上,微软宣布在Azure AI Foundry中加入更多模型,包括xAI的Grok 3和Grok 3 mini。开发者现在可以从1900多个模型中选择,新发布的模型路由器(Model Router)还可以实时为特定任务选择最佳的匹配模型。
此外,本次微软还 在Microsoft 365中推出了Copilot Tuning功能。 企业用户可以用公司的数据、知识,以低代码的方式训练模型并创建内部Agent。比如律师事务所可以创建一个Agent为法律专业人士生成文档,其中包含他们工作的风格、结构和专业知识。
面向科研团队,微软推出了名为「Microsoft Discovery」的Agent平台,希望用Agent加速科学发现——通过AI的帮助,优化从科学知识推理到假设制定、候选生成以及模拟和分析的流程。比如,微软称,利用Microsoft Discovery中的先进模型和高性能计算仿真工具,研究人员在约200小时内发现了一种新型冷却剂原型。
而在几乎同时(5月21日)召开的Google开发者大会I/O 2025上,Google也提到了Agent,但被提及的次数远没有微软发布会上的多。不同于微软强调帮助企业客户创建Agent, Google的重点在于个人消费者和创作者 ——它的Agent是在其Project Mariner下发布的,主要功能是帮助消费者更好地完成各类购物,比如购买体育赛事门票或购买食品杂货。
Project Mariner希望开发的是一款通用的个人助理,而非企业工作流程的自动化工具。在这次发布会上,Google明确将自己的to C Agent战略概括成「三个P」:Personal(个性化),Proactive(预测性),Powerful(能力)。
来源:晚晚的星河日记一点号