长河数智申请一种基于大语言模型及向量库构建知识图谱的方法专利,降低实体链接难度

摘要:国家知识产权局信息显示,北京长河数智科技有限责任公司申请一项名为“一种基于大语言模型及向量库构建知识图谱的方法”的专利,公开号 CN 119129722 A,申请日期为 2024年8月。

金融界2024年12月18日消息,国家知识产权局信息显示,北京长河数智科技有限责任公司申请一项名为“一种基于大语言模型及向量库构建知识图谱的方法”的专利,公开号 CN 119129722 A,申请日期为 2024年8月。

专利摘要显示,本申请公开了一种基于大语言模型及向量库构建知识图谱的方法,涉及知识图谱技术领域,包括:对采集的自然语言文本,利用预训练的RoBERTa模型进行分词、词性标注和语义解析处理,得到自然语言文本的语义表示向量;通过Seq2Seq框架及注意力机制,获取语义表示向量与对应的命名实体之间的关联,通过得到的关联获取命名实体;构建知识图谱;构建的知识图谱与预设领域的关系数据库进行融合,生成融合知识图谱;利用依存句法分析获取出命名实体及对应的属性,获取命名实体的实体关系,构建融合知识图谱的命名实体、属性和实体关系的结构化三元组。针对现有技术中实体链接难度大的问题,本申请将知识图谱转化为低维稠密向量表示,并构建倒排索引库等,降低难度。

来源:金融界

相关推荐