在流程上,我们可以设计两大模块:问答模块及知识库模块摘要:知识库模块用来负责文档的录入和销毁,文档的录入可以为LLM注入领域或企业内部的政策及知识,文档的销毁可以删除对应的知识,节省空间和提高问答准确率。具体实现方式是将文档tokenize后,利用向量模型转换为embedding,并存在向量数据库中,为问答模块做准备
知识库模块用来负责文档的录入和销毁,文档的录入可以为LLM注入领域或企业内部的政策及知识,文档的销毁可以删除对应的知识,节省空间和提高问答准确率。具体实现方式是将文档tokenize后,利用向量模型转换为embedding,并存在向量数据库中,为问答模块做准备。这个地方可以考虑online和offline的思路。
问答模块主要作为智能助手的角色,用户输入问题后,可以根据知识库相关信息作为reference进行回答,比如公司的PTO政策是什么等。具体实现方式是将问题转化为向量,并通过nearest neighbor算法找到Top K相似的知识向量,将对应的知识提供给LLM后,进行整合回答。
当然,真实的企业中会有更复杂的要求,比如敏感词管理等等(豆包事件)。🉑手把手带做真实企业级别后端项目。
来源:北美码农选手
免责声明:本站系转载,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本站联系,我们将在第一时间删除内容!