摘要:本文是 AI On 系列博客文章,将探讨代理式 AI、聊天机器人和 Copilot 的最新技术与实际应用。本系列还将重点介绍驱动先进 AI 智能体的 NVIDIA 软硬件,它们构成了 AI 查询引擎的基础,使这些引擎能够收集洞察并执行任务,从而深入改变人们的日
本文是 AI On 系列博客文章,将探讨代理式 AI、聊天机器人和 Copilot 的最新技术与实际应用。本系列还将重点介绍驱动先进 AI 智能体的 NVIDIA 软硬件,它们构成了 AI 查询引擎的基础,使这些引擎能够收集洞察并执行任务,从而深入改变人们的日常体验并重塑各行各业。
根据凯捷(Capgemini)预测,未来三年内,AI 智能体有望参与到企业的大多数业务中,而有效的人机协作预计将使人类参与高价值任务的比例提升 65%。
AI 智能体在学习、逻辑推理、根据情境和结果进行调整方面,能够实现甚至超越效率目标。随着它们在企业战略中占据越来越核心的地位,企业领导者必须了解其在哪些方面能产生积极影响,并证明其物有所值。
以下是代理式 AI 提升团队绩效的六种方式以及衡量其影响的实用技巧。
1. 借助 AI 智能体加速软件开发
AI 智能体可充当智能助手,帮助自动地生成、测试和部署代码。
它们能及早发现错误,从而提高软件质量、加快发布速度,还能通过提供经 AI 整理的文档信息和背景资料,帮助新工程师快速上手。
例如,NVIDIA ChipNeMo 是一组专业的智能体,它是基于定制大语言模型构建并使用 NVIDIA 内部芯片设计数据进行的训练。仅在一年时间里,它就帮助 5000 名 NVIDIA 工程师在设计、验证和文档编写方面节省了 4000 个工作日。
自部署以来,ChipNeMo 取得了以下成果:
响应准确率达到 85%,体现了其在实际应用中极为可靠。
把查找技术答案的时间从数小时缩短至数秒,简化了开发和故障排除流程。
通过识别测试漏洞和诊断故障,加快了验证周期,可覆盖典型开发周期中 30% - 50% 的工作流。
2. 推动基于数据的决策
智能体能够帮助各行业的企业轻松地从时效性强的复杂数据中提取见解,支持投资或业务战略等关键决策。
BlackRock 的 Aladdin Copilot 是一个嵌入式 AI 助手,服务于数百家金融机构的数千名用户。它让团队能够通过简单的文本提示获取投资组合见解、评估投资研究并监测可用现金余额。这不仅将研究时间从几分钟缩短至几秒,还增强了基于数据的投资决策。
VAST Data 利用智能体快速收集并整合来自内外部的信息。对于其销售团队而言,这意味着他们能够更快地获取有关客户账户的有用且最新的见解。
3. 优化 IT 运营
智能体在 IT 运营方面表现出色,包括主动监测基础设施和自动决策。
在 IT 运营中,AI 智能体具有以下优势:
更快地解决问题:自助 IT 支持智能体能够快速地处理工单并自动处理日常任务,提升用户体验。
安全自动化:在安全领域,AI 智能体有助于调查和分类,帮助团队更迅速、更准确地应对安全威胁。
企业搜索:智能体可以对整个组织的数据进行高级搜索,挖掘见解并维护机构知识。
在快节奏的电信环境中,智能体可以通过分析实时性能指标和预测服务故障来帮助企业管理网络。例如,Telenor Group 整合了适用于电信网络配置的 NVIDIA Blueprint,部署了智能的自主网络,以满足 5G 及未来网络的性能需求。
4. 简化工业和制造业运营
视频分析 AI 智能体能够与物理世界交互,可监测装配线以进行质量检查和异常检测。
和硕(Pegatron)开发了 AI 工厂 PEGA AI,在过去四年中,该平台将全公司 AI 智能体的开发速度提升了 400%。此外,该公司基于 NVIDIA Omniverse 平台构建了数字孪生平台 PEGAVERSE,使工程师能够在生产线建成前进行虚拟的模拟、测试和优化,将工厂施工时间缩短了 40%。
借助适用于视频搜索和摘要的 NVIDIA AI Blueprint 的视频分析 AI 智能体,和硕还优化了其装配流程,让每条装配线的劳动力成本降低了 7%,缺陷率下降了 67%。
西门子将生成式 AI 融入其解决方案,推出了 Industrial Copilot 智能体系统,它利用实时工厂数据为维护工程师和车间操作员提供指导。对维护工程师的采访表明,这种方式平均可节省 25% 的被动式维护时间。
Foxconn 利用数字孪生体和 AI 智能体来优化生产线,使其部署时间缩短了 50%,同时还将它们用于模拟机器人和实时监测质量与安全。
5. 提升客户服务
智能体擅长大规模处理客户服务,通过同时处理数千条咨询来减少客户等待时间。
AT&T 为员工和承包商提供了一个名为“Ask AT&T”的生成式 AI 解决方案,其中包含 100 多个已投入使用的解决方案和智能体。“Ask AT&T”使用基于 NVIDIA NeMo 和 NVIDIA NIM 微服务的大语言模型构建,可帮助用户获取相关文档并自主解决常规咨询。
“Ask AT&T”提供 24x7 全天候个性化支持,通过从组织的电子邮件、会议和过往交易中调取信息,来分享相关情景的建议。为了持续提升智能体的性能,该系统利用数据飞轮构建了实时反馈循环。
这些自动化服务使呼叫中心的转录分析成本降低了 84%。
6. 提供个性化教育
AI 智能体使个性化学习更易获取支持、可扩展、更高效,同时让讲师能有更多时间进行更深入的教学。
面对班级规模不断扩大和助教短缺的挑战,美国克莱姆森大学使用适用于检索增强生成的 NVIDIA Blueprint 开发了一个 AI 驱动的助教,用于指导学生理解复杂的概念。
这个虚拟助教并非简单地提供答案,而是逐步引导学生思考,鼓励他们主动解决问题并培养批判性思维,从而促进深度理解和学术诚信。
根据课程内容、作业截止日期和学生提交的内容,这个助教还可以提供个性化反馈和提示。它 24x7 全天候运行,无论有多少学生,都能为每位学生提供及时、量身定制的支持。
如何衡量 AI 智能体的成功?
衡量 AI 智能体的影响并非只是走过场,这对于最大化投资回报至关重要。用户对成功的定义将直接决定这些系统创造价值的能力。企业在部署智能体时往往缺乏清晰的衡量框架,因此很难证明投资回报或找出需要改进的地方。
在制定评估策略时,用户应考虑哪些指标对实现目标最为重要。例如:
采用率和参与度:监测这项技术是否被广泛使用。指标包括有多少符合条件的用户使用智能体、使用频率以及会话持续时间。高参与度意味着智能体一直在提供有效的支持。任务完成度:不仅要看使用情况,还要看效果。用户需要衡量智能体处理的任务或请求数量,以及哪些部分是在没有人工干预的情况下完成的。在软件开发中,用户可以衡量自动生成代码的比例,以了解软件在多大程度上是由智能体开发的。自动完成任务的比例高意味着员工能腾出时间从事更有价值的工作。
生产力和效率提升:量化节省的时间。解决 IT 问题所需的时间、决策报告生成时间以及客服的平均处理时间等指标有助于证明效率明显提升。
业务成果:将智能体的绩效与实际商业表现挂钩。这可能包括支持服务中每次互动的成本、软件开发中的产品上市时间,或 IT 运营中减少的计划外停机时间。
高质量的用户体验:确保系统既可信又有效。可以考虑为开发人员提供代码质量评分,在基于数据的决策中预测准确性,或在服务场景中提供客户满意度评分。
要点:衡量 AI 智能体的成功远不止一个数字,采用率、效率、准确性和业务影响都很重要。通过预先选择合适的指标组合,企业可以验证智能体的成效同时不断完善和改进智能体创造价值的方式。
来源:NVIDIA英伟达中国