摘要:向量检索技术正在成为RAG智能问答的“隐形功臣”,让很多企业/专业领域繁复庞大的知识库真正“活起来”,而作为产品经理,理解他的“有效”和“有限性”,能真正地将这个检索技术为产品所用。
向量检索技术正在成为RAG智能问答的“隐形功臣”,让很多企业/专业领域繁复庞大的知识库真正“活起来”,而作为产品经理,理解他的“有效”和“有限性”,能真正地将这个检索技术为产品所用。
产品经理小明收到一家大型科技公司的RAG项目需求:要构建一个用于员工QA的智能chatbot产品。
公司希望这个产品既能回答常见的、标准的公司政策问题(如“如何申请出差津贴”、“公司的年假福利是什么样的?”),同时又能应对各类复杂的、非标准化问题(如“跨团队合作的最佳实践是什么?”)。
作为产品经理,小明与开发讨论起技术实现。
开发摸着下巴,若有所思:“标准化问题还好说,但如果问题复杂,还是非标准化的。需要模型有更强的语义检索能力,可以在知识库里找到最合适用户的答案。咱们就用向量检索技术来做吧。”
聊到这里,小明也不免好奇,向量技术究竟是什么?它在RAG的实践中起到什么作用?
这篇文章会介绍向量技术在RAG中的应用,其核心概念、实践流程以及在产品中的具体应用场景。
在机器学习领域,向量是一组用数字表示的数学对象,通常用于描述一个文本、图像或其他数据的语义特征。这些数字是从深度学习模型中提取的,能够捕捉文本或数据的含义,并用这种形式来表示语义关系。
你可以把“向量”想象成一个坐标点,处于一个高维空间中(比如3维空间、100维空间甚至更高)。在这个空间中,语义相似的内容会靠得更近,而语义差异大的内容则会距离更远。
例如,“如何申请年假?” 和 “怎么请假?”这两个问题的表达方式是不同的,但语义非常接近。如果用向量表示,它们会被映射到一个高维向量空间中相邻的区域,从而使得计算机知道它们含义相近。而“公司年假政策是什么?”和“跨团队合作的最佳实践是什么?”,虽然语法结构有点相似,但含义天差地别,在向量空间中会有较远的距离。
RAG主要通过“检索 + 生成”两个阶段结合来处理复杂的问题,简单来说,它的步骤可以概括为:
问题理解(Query Understanding)用户输入问题后,系统首先通过自然语言处理模型将问题转化为模型可理解的形式。知识检索(Knowledge Retrieval)RAG会利用检索技术(如向量检索或传统关键词检索)从知识库中提取与问题语义相关的内容。内容生成(Answer Generation)RAG通过生成式AI模型(如GPT-4、Claude)将检索到的内容与用户问题结合,生成自然语言回答。答案输出(Response Output)最终生成的回答会以用户可以理解的形式输出。由此可以看到,向量技术是语义检索的核心。RAG需要从一个庞大的知识库中找到与用户问题最相关的内容,然后再将这些内容传递给模型进行回答。而向量的作用是把用户的问题和知识库内容都转化为高维语义向量,并通过数学方法找到两者之间的距离。
具体应用:
向量化过程: 用户输入问题“年假如何申请?” → 转化为向量 V1 知识库中存储的文本片段“年假申请流程:登录HR系统申请” → 转化为向量 V2 向量检索通过计算 V1 和 V2 的距离,判断它们的语义是否相关,距离越近,匹配度越高。实际输出: RAG通过向量检索找到匹配的内容后,将这段知识传递给生成模型,生成回答:“请登录HR系统,通过‘请假申请’模块提交年假申请。”作为AI产品经理,了解向量检索的“能做什么”和“不能做什么”也很重要。
亮点
来源:人人都是产品经理一点号