AI智能体进化论：Anthropic创始人聚焦工具、上下文、代码与安全

摘要：AI智能体当前在科技界炙手可热，从Google DeepMind、OpenAI到Anthropic，各大科技巨头正激烈角逐，致力于让大型语言模型（LLM）具备自主执行任务的能力。这类前沿技术被业界称为Agentic AI（代理式人工智能），已成为硅谷新的讨论热

AI智能体当前在科技界炙手可热，从Google DeepMind、OpenAI到Anthropic，各大科技巨头正激烈角逐，致力于让大型语言模型（LLM）具备自主执行任务的能力。这类前沿技术被业界称为Agentic AI（代理式人工智能），已成为硅谷新的讨论热点，吸引了包括英伟达、Salesforce在内的众多企业探索其颠覆行业的潜力。

上周，Sam Altman在一篇博客文章中预言：“我们坚信，到2025年，首批AI智能体将步入职场，并显著改变企业的生产效率。”

广义而言，AI智能体是一种能够自主执行任务的软件系统，其运行往往仅需极少的监督，甚至完全无需监督。任务的复杂度越高，对智能体的智能水平要求也越高。对于许多人来说，当前的LLM已足够聪明，能够驱动智能体完成一系列实用任务，比如填写表单、搜索食谱并将所需食材加入在线购物车，或者在会议前利用搜索引擎迅速完成最后的资料搜集，并生成精炼的要点概述。

2023年10月，Anthropic展示了一款先进的AI智能体Claude的一项扩展功能——“Computer Use”。顾名思义，该功能允许用户像指挥人类一样，指示Claude操作电脑，包括移动光标、点击按钮和输入文本。用户不仅能与Claude进行对话，还能要求它直接在屏幕上执行特定任务。

Anthropic指出，尽管该功能目前仍存在操作繁琐和易出错等问题，但已向一小部分测试人员开放，其中包括来自DoorDash、Canva和Asana等公司的第三方开发者。

该项目预示着AI智能体未来的发展趋势。为了更深入地探讨这一趋势，MIT Technology Review采访了Anthropic的联合创始人兼首席科学家Jared Kaplan，他分享了关于AI智能体在2025年可能发展的四个方向（以下为Kaplan回答的精简版，以提升表述的清晰度和适应篇幅）。

AI智能体：未来更擅长使用工具的发展趋势

"深入理解AI的能力：从任务复杂度到环境适应性的飞跃"

Jared Kaplan，Anthropic的联合创始人兼首席科学家，对于AI的发展有着独到的见解。他提出，我们可以从两个维度来全面把握AI的能力：一是AI系统所能执行的任务复杂度，这随着系统的智能化进程不断提升；二是AI所能利用的环境或工具类型，这一维度的拓展使得AI的应用场景更加广泛。

"若我们将目光投向近10年前的DeepMind围棋模型AlphaGo，不难发现，它已在围棋这一领域超越了人类棋手的智慧。然而，如果AI的能力仅仅局限于棋盘之上，那么它的应用场景无疑将受到极大的限制。即便其智能水平再高，也难以在现实世界中发挥其真正的价值。" Kaplan语重心长地说道。

确实，AI的潜能远不止于此。随着文本模型、多模态模型的不断进步，以及“Computer Use”等功能的出现，AI正逐步打破传统环境的束缚，融入到更加多样化的任务中。这不仅仅是技术上的突破，更是AI实用性的一次飞跃。

"我们对‘Computer Use’这一功能感到无比兴奋，因为它为AI的发展带来了全新的可能性。" Kaplan的眼神中闪烁着期待的光芒，"在过去，大语言模型往往只能依赖于特定的提示或工具，且只能在特定的环境中发挥作用。但‘Computer Use’的出现，将极大地提升模型在执行不同任务、甚至是更复杂任务时的能力。这意味着，AI将不再局限于某个特定的领域或环境，而是能够在更广阔的舞台上展现其才华。"

更重要的是，随着AI能力的不断提升，它也将逐渐学会自我反思和错误识别。在面对高风险问题时，AI将能够意识到自身的局限性，并主动寻求用户的反馈和建议。这种自我学习和进步的能力，将使得AI在未来的发展中更加稳健和可靠。

展望未来，AI的应用场景将更加广泛。从家庭助手到医疗诊断，从自动驾驶到智能制造，AI将渗透到我们生活的方方面面。而这一切的实现，都离不开AI对于环境的适应性和工具利用能力的提升。

在“Computer Use”的基础上，未来AI可能会进一步融入到更多的数字化环境中。比如，通过与其他智能设备的联动，AI将能够实时获取和处理来自不同传感器的数据，从而更加精准地理解用户的需求和意图。同时，AI还将学会利用云计算、大数据等先进技术，进行更加高效的数据处理和分析。

此外，随着机器人技术的不断进步，AI也将逐渐融入到实体环境中。从简单的机械臂到复杂的仿生机器人，AI将能够在不同的物理场景中发挥其作用。这将使得AI在医疗、救援、建筑等领域的应用更加广泛和深入。

在这个过程中，我们也需要关注AI的伦理和安全问题。如何确保AI在利用环境和工具的过程中不会侵犯用户的隐私和权益？如何防止AI被恶意利用或滥用？这些问题都需要我们在AI的发展过程中进行深入的思考和探讨。

总之，从任务复杂度到环境适应性的飞跃，AI正在以惊人的速度成长和进步。我们期待着未来AI能够为我们带来更多的惊喜和便利，同时也需要时刻保持警惕和谨慎，确保AI的发展始终符合人类的价值观和利益。在未来的日子里，让我们携手共进，共同见证AI的辉煌未来吧！

AI的新篇章：更深入地理解上下文，解锁无限潜能

Claude的效能发挥：深度理解个体与情境，精准执行，安全为先

为了让Claude这样的AI智能体能够真正发挥其效用，它需要对您的具体情况、所处的环境以及所面临的约束条件有全面而深入的了解。这不仅仅局限于您的职业角色、写作风格这些个人化的特征，更深入到您和您所在组织的核心需求与期望。

Jared Kaplan，Anthropic的联合创始人兼首席科学家，对于AI智能体的未来发展有着独到的见解。他坚信，Claude将会在这方面取得显著的进步。通过从您的文档、Slack聊天记录等丰富的信息源中搜索和学习，Claude将能够精准地捕捉到对您有用的信息，从而为您提供更加个性化和高效的服务。

“在智能体的讨论中，我们往往低估了这一点。”Kaplan强调，“一个系统不仅要有用，还需要安全、可靠，能够准确无误地完成您所期望的任务。这是衡量AI智能体价值的重要标准。”

当然，我们也需要明确一点，并不是所有的任务都需要Claude进行大量的推理和计算。例如，在打开Google Docs之前，我们并不需要AI进行长时间的深思熟虑。这正是未来AI智能体发展方向的一个重要启示：在确保智能体具备足够的推理能力的同时，我们也需要让它学会在何时何地发挥这种能力，以及在何时何地避免不必要的浪费。

为了实现这一目标，AI智能体需要具备更加灵活和智能的决策机制。它应该能够根据任务的具体需求和上下文环境，自动调整其推理和计算的力度。例如，在面对一些简单且重复的任务时，AI可以快速地给出答案，而无需进行复杂的推理过程；而在面对一些复杂且需要深入思考的问题时，AI则应该充分发挥其推理能力，为我们提供更加准确和全面的解答。

此外，AI智能体还需要具备更强的学习和适应能力。随着我们不断与AI进行交互和沟通，它应该能够逐渐理解我们的习惯、偏好和需求，并据此调整其服务方式和内容。这种学习和适应的能力不仅有助于提升AI的智能化水平，还能够为我们提供更加个性化和贴心的服务体验。

当然，在追求AI智能体高效和个性化的同时，我们也不能忽视其安全性和可靠性。毕竟，一个不安全的AI智能体可能会对我们的隐私和数据安全造成威胁。因此，在开发和应用AI智能体的过程中，我们需要严格遵守相关的隐私和数据保护法规，确保用户的个人信息和数据安全得到充分的保障。

展望未来，随着技术的不断进步和应用的不断深化，Claude这样的AI智能体将会在各个领域发挥越来越重要的作用。无论是在家庭助手、医疗诊断、自动驾驶还是智能制造等领域，AI都将以其独特的优势和价值为我们带来更加便捷、高效和智能的生活和工作方式。

同时，我们也需要保持对AI技术的敬畏之心，不断关注其发展和应用所带来的社会影响和挑战。通过加强监管和合作，我们可以共同推动AI技术的健康发展，为人类社会创造更加美好的未来。

总之，Claude等AI智能体的未来发展将取决于我们对其深度理解个体与情境、精准执行、安全为先等能力的不断提升和优化。让我们携手共进，共同迎接AI技术的新篇章吧！

强化代码助手：提升能力，优化编程体验

"在‘Computer Use’功能的萌芽阶段，我们怀揣着一份热忱，渴望与广大的开发者携手共进，共同探索这一前沿领域的无限可能。为此，我们计划推出一个测试版，诚邀开发者们亲身体验，并提供宝贵的反馈意见。我们相信，通过大家的共同努力，这些系统将逐步趋于完善，最终得以广泛采纳，真正融入用户的日常工作中，成为他们不可或缺的协作伙伴。

在这个充满创新与变革的时代，众多行业巨头如DoorDash、Browser Company和Canva等，正以前所未有的热情投身于浏览器交互的创新实践中。他们不仅勇于尝试不同类型的交互方式，更借助AI的强大力量，精心设计这些交互，旨在为用户带来更加流畅、便捷的使用体验。

展望未来，代码助手领域同样充满了无限遐想与期待。我深信，随着技术的不断进步，代码助手将实现更加卓越的改进。这对于开发者而言，无疑是一个振奋人心的消息。如今，Claude 3.5在编程领域的表现已经引起了广泛的关注与热议。它不仅仅局限于提供简单的自动补全功能，而是展现出了更加深入的理解能力。它能够精准地捕捉到代码中的问题所在，进行高效的调试，通过观察代码的运行行为，精准地定位并修复错误。

Claude 3.5的这一突破，无疑为开发者们带来了前所未有的便捷与高效。它让编程变得更加轻松、愉快，让开发者们能够更加专注于创意与逻辑的碰撞，而不必为繁琐的代码调试所困扰。同时，这也预示着代码助手领域正朝着更加智能化、人性化的方向发展。

当然，我们也清醒地认识到，技术的每一步进步都离不开用户的支持与反馈。因此，我们诚挚地邀请广大开发者们参与到‘Computer Use’功能的测试中来，与我们共同见证这一领域的成长与蜕变。您的每一条建议、每一个想法，都将为我们提供宝贵的灵感与动力，推动我们不断前行。