摘要:这些雨后春笋般的智能体越来越多,性能强大、增长迅速,但彼此之间却无法协作——有的智能体用来分析数据,有的用来编写代码,有的用来自动化客户关系管理(CRM)工作流,但它们彼此孤立,互不往来。
智能体(Agent)是个不可逆的趋势。但今天的AI 智能体似乎还处于一个“前标准化”阶段。
这些雨后春笋般的智能体越来越多,性能强大、增长迅速,但彼此之间却无法协作——有的智能体用来分析数据,有的用来编写代码,有的用来自动化客户关系管理(CRM)工作流,但它们彼此孤立,互不往来。
这就好比几十年前的互联网:在万维网出现HTTP协议之前,在电子邮件拥有SMTP协议之前,我们曾陷于定制集成、系统碎片化和脆弱工作流的困境中。
直到开放协议与共享基础设施的出现,互联网才真正实现了规模化,催生了现代网络、全球通信和全新经济体。
不过,这种状况正在发生改变。一个新的技术栈正在形成,它支撑着下一代“互联网”的发展——这次不是为了人类浏览网页,而是为了自治的智能体在系统之间协作。核心由四个开放组件组成:
Google 的 Agent2Agent(A2A):一种智能体发现和通信协议Anthropic 的 Model Context Protocol(MCP):用于工具使用与外部上下文访问的标准Apache Kafka:一个事件驱动的通信结构,提供可靠、解耦的协调机制Apache Flink:一个实时处理引擎,用于丰富、监控并响应智能体活动流本文中,我们将探讨这些技术如何协同工作,为何仅靠协议还不够,以及这个新栈如何提供从孤立机器人走向动态、智能协作生态所需的基础设施。
至少现在看来,智能体看起来是一个不可逆的趋势。而且,大多数公司将不仅部署一个AI智能体,而是几十个。这些智能体将编写代码、分类支持工单、分析客户数据、管理员工入职、监控基础设施等等。
但当下的工具链尚未为这一未来做好准备。
Agent孤岛 (图源:confluent)
那么,问题来了:
智能体彼此无法通信:每个智能体运行在自己的“沙盒”中,CRM 智能体不知道数据仓库智能体刚发现了什么,客服智能体无法响应监控智能体刚刚标记的异常。工具使用方式脆弱且定制化严重:没有统一的方式来调用工具或 API,结果就是集成方式硬编码、逻辑不可重用。框架不一致:不同的运行时以不同方式构建智能体——有的像聊天机器人,有的像DAG(有向无环图),有的像递归规划器。没有可移植的执行层,也没有共享状态。智能体被当作一次性脚本开发:它们通常是线性、同步、短暂的原型,但现实系统需要处理重试、失败、协调、日志和扩展能力,这些都需要基础设施。缺乏协作主干:没有事件总线、共享内存或可追踪的行为历史。一切都锁定在直接的HTTP调用中,或者深埋于日志中。结果就是:信息孤岛、重复建设、系统脆弱。那该怎么办?
解决方案不是打造一个巨型平台,而是构建一个开放协议、事件驱动架构与实时处理组成的共享技术栈。
今天的智能体生态就像早期互联网:每个系统都能完成有用的工作,但彼此孤立、不兼容。就像没有HTTP的浏览器无法与服务器交流一样,AI智能体也无法轻松发现彼此或协作。
Google 的 A2A 协议试图改变这一点:它不是另一个智能体框架,而是一个通用协议,无论由谁构建、运行在哪,任何智能体都能连接。
A2A 就像 HTTP 一样,为智能体定义了一种共享语言,让它们可以:
通过 AgentCard(JSON 格式)宣布自身能力和交互方式;使用结构化交互(基于 JSON-RPC)发送任务请求,并接收结果或产出;利用 SSE(Server-Sent Events)推送任务状态,实现实时反馈;交换富内容(文件、结构化数据、表单等);通过 HTTPS、安全认证与权限控制,确保默认安全。A2A 的优势在于:它并不重造轮子,而是复用 HTTP、SMTP 等标准的成熟经验,易于集成和推广。
但这只是其中一半。
Anthropic 的 MCP 解决的是智能体如何使用工具、调用 API 和访问上下文的问题,也就是智能体如何“行动”。它标准化了函数调用、外部集成、上下文注入等行为。
可以理解为:
MCP 是智能体的“工具箱”;A2A 是智能体的“对话协议”。二者结合,构建出智能体网络的蓝图:
MCP 提供单体智能(individual intelligence);A2A 激发群体智能(collective intelligence)。但光有协议还不够。要在企业环境中支撑成百上千个智能体协作,还需要强大的通信基础设施。
想象一下,如果一家公司所有员工只能通过私聊来沟通,一个个单独发消息来协调项目,信息同步将变得混乱不堪,无法扩展。
这正是智能体生态系统在缺乏消息主干时的困境。
每个智能体都要手动知道对方是谁、在哪、是否在线——这会迅速变得难以管理。
这时,Apache Kafka 和 Apache Flink 就登场了。众所周知,Kafka是一个高吞吐、持久化的分布式事件流平台,用于发布/订阅实时事件流,具有解耦生产者与消费者、可重放、易扩展等特点。而Flink作为实时流式计算引擎,支持状态管理、高吞吐、低延迟的事件处理,可对流进行过滤、聚合、触发动作等。
二者搭配起来,非常如鱼得水——Kafka 好比血液循环系统;Flink则是神经反射系统。Kafka 加上 Flink就会为智能体生态提供基础设施。
Kafka 和 Flink 提供了解决协议通信难题的“基础支撑”:
解耦通信:智能体发布事件(如“任务完成”、“发现洞察”)到 Kafka 主题,订阅者无需提前知道发送者是谁。可观测性与可重放性:Kafka 日志是时间有序、可追踪、可重放的。实时决策:Flink 可实时响应流事件,动态过滤、聚合、触发下一步操作。容错与扩展:Flink 可横向扩展,保持状态,支持长任务的中断恢复。流原生协作:智能体通过事件流异步协作,不必同步阻塞。A2A, MCP, Kafka,Flink 协作一览(图源:confluent)
我们正站在软件演化的关键节点。
正如互联网协议(如HTTP、SMTP)与基础设施(如TCP/IP)曾开启全球互联的新时代,如今的A2A、MCP、Kafka、Flink,也在构建一个全新的“智能体互联网”。
这个新技术栈不再为人类浏览页面而设计,而是为自治系统之间的推理、决策与行动而生。
A2A与MCP 提供通信与工具标准;Kafka与Flink 提供实时协调、观测与弹性基础;框架如 LangGraph、CrewAI、ADK 则实现“如何构建”的标准化。未来不是单一智能体的堆砌,而是智能体之间的连接、协作与演化。
下次你在构建智能体时,不仅要问:它能做什么?更要问:它能否沟通?能否协调?能否进化?
因为未来不是“智能体驱动”,而是“智能体协同”。
参考链接: https://thenewstack.io/a2a-mcp-kafka-and-flink-the-new-stack-for-ai-agents/
来源:51CTO一点号