Spring AI或Langchain4j 做工业级别项目

360影视 欧美动漫 2025-05-27 14:02 6

摘要:知识库模块用来负责文档的录入和销毁,文档的录入可以为LLM注入领域或企业内部的政策及知识,文档的销毁可以删除对应的知识,节省空间和提高问答准确率。具体实现方式是将文档tokenize后,利用向量模型转换为embedding,并存在向量数据库中,为问答模块做准备

在流程上,我们可以设计两大模块:问答模块及知识库模块

知识库模块用来负责文档的录入和销毁,文档的录入可以为LLM注入领域或企业内部的政策及知识,文档的销毁可以删除对应的知识,节省空间和提高问答准确率。具体实现方式是将文档tokenize后,利用向量模型转换为embedding,并存在向量数据库中,为问答模块做准备。这个地方可以考虑online和offline的思路。

问答模块主要作为智能助手的角色,用户输入问题后,可以根据知识库相关信息作为reference进行回答,比如公司的PTO政策是什么等。具体实现方式是将问题转化为向量,并通过nearest neighbor算法找到Top K相似的知识向量,将对应的知识提供给LLM后,进行整合回答。

当然,真实的企业中会有更复杂的要求,比如敏感词管理等等(豆包事件)。🉑手把手带做真实企业级别后端项目。

         

来源:北美码农选手

相关推荐