摘要:现在,我们正在进入一个全新的时代,在这个时代,AI 不仅仅是模型,而是拥有自主思考和行动能力的agent。它不仅能理解你的指令,还能像人类一样规划、推理、并利用外部工具来完成任务,那将带来怎样的变革?这正是 AI agent 的核心理念。它们超越了传统模型的局
Google: 2025年是AI Agents元年;
Sam Altman: 2025年我们能构建出达到AGI L3的Agent。
Google trends 关于Ai Agents搜索词汇过去5年的趋势如下,最近几个月突然加速:
最新Google发布了一份关于Agents的白皮书,写的特别精彩,50多页的pdf。
Agent:AI 的新边界,从模型到智能体
现在,我们正在进入一个全新的时代,在这个时代,AI 不仅仅是模型,而是拥有自主思考和行动能力的 agent。它不仅能理解你的指令,还能像人类一样规划、推理、并利用外部工具来完成任务,那将带来怎样的变革?这正是 AI agent 的核心理念。它们超越了传统模型的局限,将 AI 的应用推向了新的高度。
Agent 的核心:不止是模型
那么,到底什么是 agent 呢?简单来说,agent 是一个能够观察世界、思考决策并采取行动的程序。它不是一个被动执行指令的工具,而是一个主动解决问题的智能体。我们可以将其拆解为以下三个核心组件:
Agent 与模型:关键区别
现在,你可能会问:“agent 和模型到底有什么区别?”这里有一个简单的对比:
下图是一个在编排层使用 ReAct 推理构建的Agent示例。它基本上通过 1-n 次思考、动作(带有输入)和观察的迭代,以及访问关键工具来尝试解决问题。
工具:连接世界的钥匙
工具是 agent 的核心能力。它们赋予了 agent 与外部系统交互的能力,包括:
扩展 (Extensions) :标准化连接 API 的方式,让 agent 无需关心底层实现细节,可以轻松调用外部服务。函数 (Functions) :在客户端执行的自定义代码,可实现更精细的数据处理和系统控制。数据存储 (Data Stores) :让 agent 可以访问外部数据源,如网站、文档、数据库等,以扩展知识面。数据存储通常实现为向量数据库。也可以为Agent提供各种格式的数据。
增强 agent 的学习能力
除了强大的工具,我们还可以使用以下方法来增强 agent 的学习能力:
Agent 的实际应用:无限可能
有了这些强大的组件和技巧,我们可以构建出各种各样的 agent。例如:
旅行规划助手: 根据用户的需求,查询航班、酒店,并生成行程安排。代码生成器: 根据用户的描述,自动编写代码,甚至可以运行并测试。智能客服: 理解用户的问题,并使用知识库和工具来提供解答。Agent 的未来:一个新时代的开端
Agent 的发展潜力是巨大的,它不仅仅是技术的进步,更是一场思维方式的变革。随着工具的日益完善和推理能力的不断提升,agent 将逐渐成为我们工作和生活中不可或缺的一部分。
最后,别忘了:
白皮书地址:https://www.kaggle.com/whitepaper-agents
来源:人工智能学家