摘要:单轮检索局限:当用户仅反馈“空调制冷效果差”、“持续发热三天”等模糊信息时,传统 RAG 缺乏追问能力,无法定位根因;语义跳跃失控:对话中突然切换话题(如患者从“咳嗽”转向“头痛”)时,传统方案因无法关联跨域知识导致误判。
在智能客服与医疗问诊领域,用户模糊描述导致的多轮对话断裂与语义关联缺失,长期阻碍决策效率提升。传统 RAG 技术面临双重困境:
单轮检索局限:当用户仅反馈“空调制冷效果差”、“持续发热三天”等模糊信息时,传统 RAG 缺乏追问能力,无法定位根因;语义跳跃失控:对话中突然切换话题(如患者从“咳嗽”转向“头痛”)时,传统方案因无法关联跨域知识导致误判。阿里云瑶池旗下的云原生数据仓库 AnalyticDB PostgreSQL 版 GraphRAG 技术,创新融合知识图谱动态推理+向量语义检索,通过实体关系映射与多跳路径优化,构建可应对复杂场景的决策引擎。本文将通过家电故障诊断和医疗预问诊两大高价值场景,解析其如何实现从“被动应答”到“主动决策”的跨越。
相比传统 RAG,结合向量和图的 GraphRAG 能更高效地处理大规模知识的关联检索与分析。GraphRAG 是通过图来保存文本知识中实体之间的联系。通过将文本抽象为图数据,知识图显著简化了输入文本,减少冗长问题。通过检索子图或图社区,GraphRAG 能够捕捉更广泛的上下文和联系,有效应对 QFS 挑战。
构建一个完整的 GraphRAG 业务,需要三个重要的子系统:知识图谱理解抽取系统、 GraphRAG 引擎系统、支持 RAG 的 AI 工程框架。
1、知识图谱理解与抽取
知识图谱系统用于实现知识建模和抽取。最新的阿里通义千问 Qwen3 在文档理解、数据抽取、问题分析、多语言识别等方面表现优异,成本大幅下降,性能全面超越DeepSeek-R1、OpenAI-o1等全球顶尖模型。我们利用通义千问 Qwen3,完成对文本的分析并进行实体和关系的三元组抽取,从而构建相应的知识图谱。
2、GraphRAG 引擎
阿里云瑶池旗下的云原生数据仓库AnalyticDB PostgreSQL(以下简称ADB PG)作为一款具备 GraphRAG 引擎的MPP数据库,它具备完整的事务处理、高吞吐写入和流批一体引擎以及提供关系型数据存储、全文、向量存储和图数据存储功能,显著简化应用构建的过程,提供精准分析和决策支持。通过整合 Qwen3 的知识抽取能力和 AnalyticDB PostgreSQL 的图引擎优势,GraphRAG 可以实现更全面的上下文理解和信息检索,优化业务流程。
3、Data Agent Platform
AI框架作为业务层的"智能中枢",负责实现从原始数据到智能服务的端到端闭环。Dify on DMS是阿里云瑶池数据库推出的一站式AI应用部署解决方案。通过DMS可以轻松将Dify应用部署到阿里云上,并与通义大模型和瑶池数据库生态等无缝融合。无论是数据处理、模型训练,还是AI应用的快速上线,DMS都能提供低门槛、开箱即用的体验,构建企业级安全稳定的Data+AI平台。
▶︎ 图谱构建
知识图谱构建是一个融合多源数据、自然语言处理(NLP)技术和图数据库管理的系统性工程,ADB PG GraphRAG 通过生成式模型将原始文本转换为图谱的“节点(实体)”和“边(关系)”,其核心流程包括:
对文本进行chunk并从中抽取实体属性(如“特斯拉CEO:马斯克”) → 解决实体同名歧义(如“鹅厂→腾讯”)与数据冗余问题 → 节点去重与实体归一化处理 → 将抽取到的节点转换为Cypher语句写入ADB PG图存储 → 同步将chunk生成文本向量存入ADB PG向量库中。
如此,用户在查询的时候既可以通过embedding进行语义相似度搜索,也可以通过知识图谱搜索正确的回答,大大提升回答的准确度。
▶︎ 图谱融合
针对跨文献抽取实体时出现的命名差异问题(如“鹅厂”与“腾讯”指向同一实体),ADB PG GraphRAG采用分层消歧策略:
支持领域专家自定义映射规则(例如强制将“计算机”标准化为“电脑”),实现基础术语统一;其次利用公共样本库执行聚类分析,自动归集同义实体(如合并“北医三院”与“北京大学第三医院”);对于复杂歧义场景,则调用大语言模型进行深度语义匹配。通过规则定义、数据驱动聚类和AI模型协同,图谱融合能够有效消除实体歧义,为精准检索奠定基础。
▶︎ 关联检索
当用户发起查询时,关联检索首先抽取问题中的实体关系,沿知识图谱检索相邻N跳节点的语义内容,通过相似度匹配定位最相关节点及对应文本块,显著提升多跳问题的准确性与可解释性。
▶︎ 全局检索
若检测到对话跳跃现象:包括语义突变或跨领域提问,系统会自动触发全局检索,将用户问题转化为向量后执行全图搜索,快速定位Top-N相似节点,并结合会话上下文重定位对话路径,提升回答的准确度。
▶︎ 多路检索召回
结合“关联检索”和“全局检索”的两个能力,ADB PG GraphRAG服务还提供了多路检索的自适应召回能力,同步计算关联检索与全局检索的置信度,默认优先采用关联节点结果,同时支持通过调整置信度阈值动态干预决策。
▶︎ 图谱检索排序
为了优化检索结果的相关性和准确性,ADB PG GraphRAG服务实现了重排序(Reranking)机制,优化结果优先级,确保返回最契合用户需求的信息序列。
在对问题进行分析处理时,行业专家通常会构建一个或多个知识图谱。这些知识图谱基于具体的应用场景设计,通过与用户进行追问式对话,能够将广泛的问题逐步细化,并最终定位到具体的状况上。通过这种层次化的分析方法,可以有效地从宏观层面的问题过渡到微观层面的特定情境,从而为用户提供精准且针对性强的解决方案。
在以家电为代表的智能电子行业中,咨询类客服系统的需求日益凸显,但是用户咨询的问题往往过于模糊,不能直接通过AI Agent定位到客户的问题并给出解决方案。所以,这类系统旨在通过多轮提问,获取更多有价值的信息,精准地识别用户在产品使用过程中遇到的具体问题,并据此提供切实可行的解决方案。它不仅能够有效提升用户体验,还能进一步优化售后服务流程。此类智能化客服平台,凭借其卓越的问题诊断能力和高效的服务响应机制,在当今竞争激烈的市场环境中显得尤为重要。
下面是一个空调售后机器人的故障问答场景:
--Agent:你好,我是空调售后助手,请问有什么可以帮你?
--User:我的空调制冷效果不理想,能帮忙看一下么?
--Agent:是你的空调吹风风量小还是制冷效果差?
--User:制冷效果不好。
--Agent:请看一下空调的运行模式,是不是在制冷模式?
--User:制冷模式。
--Agent:空调滤网是否长时间没有清理?
--User:是的。
--Agent:请清理滤网后再观察一下空调制冷情况。
在空调售后案例中,用户提出“制冷效果不理想”的模糊问题。售后Agent通过多轮追问引导用户补充信息:首轮区分“风量小”或“制冷效果差”,第二轮确认空调运行模式,第三轮核查滤网状态,最终给出“需要清理滤网后观察”的解决方案。整个过程依托知识图谱的实体关联路径(运行模式→滤网状态),实现从泛化问题到具体根因的精准定位,有效提升了售后服务效率。
在现代医疗问诊场景中,提供24小时在线智能预问诊服务以减轻医生负担显得尤为重要,但是AI Agent通常无法通过传统的“望闻问切”方法逐步从患者那里获取更多有助于判断疾病的信息。因此需要一个为患者和医生提供决策参考的辅助系统,通过患者提供的症状信息,判断潜在病症,为患者提供快速简便的建议,并协助医生作出合理决策。
--Agent:你好,有什么问题可以帮你?
--User:最近一直肚子疼,不知道什么原因。
--Agent:请问是上腹疼痛么?
--User:是的,感觉是胃这边比较疼。
--Agent:是否有恶心或者消化不良、嗳气、黑便等其他症状?
--User:吃完饭会有点反酸。
--Agent:您可能有胃部相关的疾病,建议继续做胃镜或者x线钡剂检查以确认具体的病因。
医疗问诊辅助系统能够基于医疗专用的知识图谱,创建症状 -> 诊断 -> 检查 -> 疾病之间的知识关系图谱,并通过持续整合病历案例不断优化诊疗路径,提升诊疗效率。在Agent使用过程中,系统会根据患者的主诉症状进行图谱初筛,生成附带置信度的初步诊断;当置信度不足时启动多轮对话补充关键症状,如发热时长、疼痛部位等,逐步收敛疾病范围直至达到置信阈值。最终依据医疗规范输出检查建议或明确疾病结论,直接衔接给药、住院等后续流程。在临床实践中,该系统不仅能引导患者精准匹配科室分诊,更能降低资源匮乏地区医生因经验不足导致的误诊风险。
来源:企业上云那些事