Dify知识库——元数据

360影视 欧美动漫 2025-03-20 08:42 2

摘要:元数据是用于描述其他数据的信息。简单来说,它就是“关于数据的数据”。就像一本书的目录或标签,可以为你介绍数据的内容、来源和用途。通过提供数据的上下文,元数据能帮助你在知识库内快速查找和管理数据。

随着V1.1.0版本的发布,增加了元数据的功能,那我们就聊聊吧!

一、什么是元数据?

元数据是用于描述其他数据的信息。简单来说,它就是“关于数据的数据”。就像一本书的目录或标签,可以为你介绍数据的内容、来源和用途。通过提供数据的上下文,元数据能帮助你在知识库内快速查找和管理数据。

知识库元数据定义

字段:元数据字段是用于描述文档特定属性的标识项,每个字段代表文档的某个特征或信息。例如“language”“table”。

字段值:字段值是该字段的具体信息或属性,例如“english”“user”。

字段值计数:字段值计数是指在某条元数据字段中标记的字段值数量,包括重复项。例如,此处的“1”是字段值计数,指该字段中有 1 个独特的字段值。

值类型:目前,Dify的元数据功能支持三种值类型,分别是【字符串】【数字】【时间】

二、如何管理知识库元数据?

1、管理知识库元数据字段

在知识库中,元数据字段分为两类:内置元数据(Built-in)自定义元数据

新建元数据字段

1)点击【添加元数据】按钮,弹出【新建元数据】的弹窗

2)在字段值类型中选择元数据字段的值类型。

3)在名称输入框中填写字段的名称。

字段名仅支持小写字母、数字和下划线(_)字符,不支持空格和大写字母。

4)点击保存按钮,保存字段。

修改元数据字段

1)点击单条元数据字段右侧的编辑按钮,弹出重命名弹窗:

2)在名称框中修改字段名称,点击保存按钮进行更新:

删除元数据字段

点击单条元数据字段右侧的删除按钮,可以删除该字段。

ps:如果删除单条字段,该字段及该字段下包含的字段值将从知识库的所有文档中删除。

在知识库元数据删除的情况下,是可以同步删除知识库内部各文档的相应元数据。

如果需要单独删除文档对应的元数据,可以直接进入文档进行删除:

点击删除按钮后,可点击保存按钮,保存此次操作,否则删除不能生效。

2、编辑文档元数据信息

批量编辑文档元数据字段

我们在知识库管理界面,我们以表结构知识库为例,进入之后会看到两个文档,选中两个文档后,页面下方会浮现操作栏,点击其中的元数据按钮,弹出编辑元数据弹框:

可以看到我们的两个文档中都已经添加了我们刚刚设置的test元数据

批量删除元数据信息

同样我们删除元数据信息也可以在刚才的批量编辑元数据的弹窗中,对相应的字段进行删除,点击删除按钮就可以删除对应的字段,并且该字段已经属于删除状态,这时候不要忘记点击保存按钮,不然这次的操作还是无效的:

三、元数据作用

提升搜索效率用户可以根据元数据标签快速筛选和查找相关信息,节省时间并提高工作效率。增强数据安全性通过元数据设置访问权限,确保只有授权用户能访问敏感信息,保障数据的安全性。优化数据管理能力元数据帮助企业或组织有效分类和存储数据,提高数据的管理和检索能力,增强数据的可用性和一致性。支持自动化流程元数据在文档管理、数据分析等场景中可以自动触发任务或操作,简化流程并提高整体效率。

四、知识库元数据和文档元数据

1、知识库元数据管理列表中的元数据字段和某篇文档中的元数据值有什么区别?

2、“在知识库管理界面删除某条元数据字段”“在编辑元数据弹窗中删除已选文档的某条元数据字段”和“在文档详情界面删除某条元数据字段”有什么区别?

五、如何使用元数据筛选知识

聊天流/工作流知识检索节点中,我们可以使用元数据筛选功能精确检索文档。该功能有助于你根据文档的元数据字段(如标签、类别或访问权限)优化检索结果。

筛选模式有三种:【禁用】【自动】【手动】三种:

其中手动模式我们可以根据不同的条件来判断,比如我们之前设置的元数据test,我们选择的是“表结构”知识库,其中有两篇文档,我们分别在两篇文档中设置了文档元数据test,并且分别赋值123和456,我们可以通过设置判断变量值是123还是456去分别导向两个不同的文档。

具体的一个操作实例后面有机会可以单独开一篇来讲讲,今天还是讲讲手动模式下,包含的参数有哪些:

元数据字段类型可选择:

元数据筛选值:

1)Variable(变量):选择变量,并选择该聊天流/工作流中需要用于筛选文档的变量。

2)Constant(常量):选择常量,并手动输入你需要的常量值。

其中日期可以通过日期组件选择相应日期。

来源:正正杂说

相关推荐