如何配置和应用DAP的数据服务

摘要:数据作为核心资产越来越多的受到企业的重视与关注,而为了保证资产的有效管理与利用,建立一套完整、全面、有效的数据管理体系至关重要。对于企业而言,数据的价值不仅仅是要做到整合、管控,更多的是要实现数据的联动,通过流动的数据服务于业务,产生业务价值,才能真正做到数据

数据作为核心资产越来越多的受到企业的重视与关注,而为了保证资产的有效管理与利用,建立一套完整、全面、有效的数据管理体系至关重要。对于企业而言,数据的价值不仅仅是要做到整合、管控,更多的是要实现数据的联动,通过流动的数据服务于业务,产生业务价值,才能真正做到数据的价值最大化。

在数据整合归集的过程中,在强化数据管理的同时,也要能对数据进行有效的治理与统一,并基于治理后的统一、标准数据服务于业务,在业务管理过程中能及时有效的获取所需的数据,这对于业务部门和人员来说,才是数据治理的目的所在。DAP数据分析作为数据治理分析平台,在数据治理、标准化的过程中,构建数据服务、对外提供数据就是DAP数据应用的方式之一。

DAP数据分析平台作为数据中台方案的核心产品,提供全方面的数据体系建设,实际企业数据整合归集的同时深度挖掘数据价值,通过数据支撑企业决策、推动业务运营。

1.方案体系

DAP平台主要面对企业数据治理分析需求,在实际项目中会结合ESB、MDM形成数据中台方案,数据中台包括主数据治理、数仓建设、数据分析、数据应用等,通过平台建设实现企业数据的整合汇聚,构建数据中心,基于数据进行分析展现、透视业务、价值挖掘,有效支撑企业的业务发展。

DAP平台作为数据中台的核心,承担了数仓建设、数据分析、数据应用等核心业务需求,通过ODS、DWD、DWS、ADS等分层策略构建数仓体系,并能实现数据集、立方体、指标集等分析模型的配置。以ESB总线平台为基础,支持源头系统到数仓的数据采集、加工、转换、汇总。MDM平台通过主数据治理,为数仓提供标准的维表支持。

2.功能架构

DAP平台在功能上包括了数仓建设、数据分析、数据资产、数据服务、算法预测等内容。

1.数仓建设:包括ODS建设、数仓建设等内容,通过数据采集、加工、转换、汇总的过程实现从源头系统到数仓的建设;

2.数据分析:基于数仓构建数据集、立方体、指标集等分析模型,通过DAP预置的可视化组件实现可视化分析与联动穿透,从而支持企业数据的查看以及业务管理;

3.数据资产:基于数仓数据构建数据资产体系,将企业数据构建成数据资产,用于企业数据的管理、价值分析以及数据共享;

4.数据服务:根据配置的各类分析模型自动构建数据服务接口,实现对外进行数据提供和应用;

5.算法模型:通过平台预置的各类算法对数据进行训练与模拟,构建算法模型对象,从而实现数据的预测与价值挖掘,支持业务层面的数据应用;

6.数据安全:通过数据加密、脱敏策略实现对关键数据、敏感数据的加密、脱敏处理,保证数据使用过程中的数据安全性。

3.数据服务

数据服务是DAP平台中非常重要的一个功能,是实现DAP价值应用的方式之一,也是DAP的数据和业务系统联动的有效手段,通过数据服务可以接收业务系统数据,也可以向业务系统提供数据,甚至实现指标报警、算法预测等数据深度应用场景,充分发挥DAP作用数据中台的数据价值。

DAP平台的数据服务主要是满足DAP平台与上下游系统集成对接的需求,通过数据服务与业务系统进行打通,实现数据采集、数据提供、业务联动等场景

1.数据采集

数据采集主要是满足DAP从源头系统采集数据的需求,通过服务API的方式实现源头系统将数据推送至DAP平台,从而实现数据的采集,满足数据加工、数仓建设的需求。

2.数据提供

数据提供主要是通过服务API对外进行数据提供,通过DAP的数据服务可以将数据集、立方体、指标集等分析模型直接发布成数据服务,对外提供API接口,业务系统调用相关的API直接获取分析模型数据。

3.算法预测

基于DAP平台的算法模型功能配置算法调用,将算法调用发布成服务API,下游系统通过传入实际值或模拟值,调用DAP的算法服务实现算法预测,从而获取预测的结果进行业务处理。

DAP产品的数据服务包括接口服务、查询服务、统计服务、指标服务、算法服务和业务服务等功能,通过提供写入、查询的API接口实现数据采集、获取、预测等业务场景需求。

1.接收服务

接收服务主要通过ODS对象的配置发布成服务API,外部业务系统调用接收服务将数据推送到DAP的ODS中。

接收服务主要满足数据采集中实时采集的场景,并且是由源头发起的数据采集,相对于参考表、源库读取等方式,接收服务主要面对需求:

1.需要实现源头系统和DAP数仓的数据实时同步集成;

2.源头系统不开放数据库,或者无法读取源头数据库结果;

3.源头系统支持调用API的方式进行数据推送。

接收服务的具体使用流程如下:

2.查询服务

查询服务主要是针对DAP分析模型的数据集进行数据查询,将查询结果提供给下游系统的场景,下游系统根据业务或使用需求调用API直接获取数据集数据。

查询服务的具体使用流程如下:

3.统计服务

统计服务主要是针对DAP分析模型的立方体进行数据查询,将查询结果提供给下游系统的场景,下游系统根据业务或使用需求调用API直接获取立方体数据。相对于查询服务,由于统计服务是基于立方体的数据,所以统计服务能提供聚合计算后的结果数据。

统计服务的具体使用流程如下:

4.指标服务

指标服务主要是针对DAP分析模型的指标集进行数据查询,将查询结果提供给下游系统的场景,下游系统根据业务或使用需求调用API直接获取指标集数据。DAP的指标集包括模型和实例,而指标服务主要针对指标实例,并且由于指标实例可以配置阈值,在通过API进行数据提供时,也会同时提供指标报警的信息。

指标服务的具体使用流程如下:

5.算法服务

算法服务是通过DAP算法模型的算法调用提供的服务API,在DAP发布算法调用后,会自动生成算法服务API,下游系统根据算法模型的特征值传入参数,调用API接口后,DAP会进行执行算法进行预测,并将预测的结果反馈给业务系统。

算法服务的具体使用流程如下:

6.业务服务

业务配置相当于查询服务、统计服务、指标服务基础上的自定义,主要是根据业务需求,自定义配置服务的来源数据以及结果参数,从而灵活的满足各种定制化的业务场景需求,同时业务服务也提供外部服务API的注册能力。

业务服务的具体使用流程如下:

DAP平台的数据服务大部分都是基于各个配置功能发布时自动生成数据服务,如接收服务、查询服务、统计服务、指标服务和算法服务都是自动生成的,只有业务服务是自定义的,用于满足灵活的业务场景需求。

1.接收服务

1.在ODS对象中配置同步方式,选择“接口推送”,并勾选“基于接收服务创建流程”:

2.接收服务中可以查看具体的接口信息:

3.在通过ESB设计器创建流程时,会自动调用DAP的接口服务进行数据写入。

2.查询服务

1.在数据集配置中选择数据集进行提交和发布:

2.发布后在查询服务中可以显示对应的服务记录:

3.在DAP中可以进行接口测试以及数据预览:

4.下游系统直接使用API接口地址进行调用。

3.统计服务

1.在立方体配置中选择立方体进行发布:

2.在统计服务中查看对应的服务发布的记录:

3.可以在DAP平台执行API接口并进行数据预览:

4.指标服务

1.在指标集的指标实例中对实例进行发布:

2.发布后在指标服务中会根据实例显示服务清单:

3.可以通过执行查看结果数据,同时根据指标阈值可以显示阈值超限信息:

4.预览时超限指标数据可以高亮显示:

5.下游系统直接使用API接口地址进行调用。

5.算法服务

1.发布算法调用模型:

2.在算法服务中查看算法信息:

3.可以手动输入参数进行执行预测,返回预测结果:

4.下游系统通过调用API并传入特征值进行预测,获取预测结果。

6.业务服务

1.在业务配置中新增业务服务,配置类型、来源数据等信息:

2.保存后,配置参数,选择结果参数字段:

3.在服务查看中查看接口信息:

4.执行查看结果:

5.服务配置支持配置入参条件:

6.执行时添加入参进行数据过滤:

7.业务接口类型除单表外,支持树表、主从表等结构:

总结分析

数据服务是DAP平台的重要功能之一,也是DAP数据的关键应用场景,通过数据服务,可以将DAP加工汇总的数据对外进行提供,保证业务系统数据使用的同时,实现业务联动,强化业务价值。

1.功能总结

数据服务包括了接收服务、查询服务、统计服务、指标服务、算法服务和业务服务。从数据流向来说,接收服务是源头系统推送数据到DAP,查询、统计、指标、业务都是直接提供数据给外部系统,算法服务是外部应用系统传入特征值,经过DAP预测后返回预测值的数据交互过程。从配置过程而言,接收、查询、统计、指标、算法服务都是通过各个功能的数据发布自动生成服务,而业务服务是自定义配置服务的过程。

2.过程总结

数据服务在使用时更多是将平台配置的内容以服务API的形式发布出去,由业务系统调用推送或获取数据的过程,所以数据服务的配置主要集中在前期的配置中,尤其是分析模型和算法模型的配置,数据服务本身并没有太多的配置工作,只有在使用业务服务时,需要手动选择数据类型和参数,但配置过程也比较简单,所以数据服务功能的使用门槛比较低。

3.说在最后

DAP数据分析平台作为综合的数据治理分析平台,主要是通过数据采集、加工、转换、汇总、分析、预测的过程实现数据的整合与应用,通过整合数据构建数仓,实现数据的汇聚;数据应用包括数据可视化、数据资产、数据服务、数据共享、数据预测等。数仓建设是基础,数据应用是价值,通过有效的数据加工整合构建一体化的数据仓库,满足各类应用场景的数据使用需求。

在实际使用中,DAP数据分析平台需要和ESB数据总线平台结合使用,通过数据总线平台快速生成数据采集流程,实现DAP的数据采集、数仓构建,这是DAP平台最基础的解决方案。为了保证数仓采集数据的准确性,以及各个业务系统基础数据的一致性,会在DAP基础方案的基础上添加MDM平台构建一体化数据中台方式,从而实现集主数据治理、数仓建设、数据分析为一体的数据中台方案,从而保障数据治理的准确性和价值,三者相辅相成,共同完成数据治理的全过程,从而为企业的数据体系建设提供全面的支持。

本文由@数通畅联原创,欢迎转发,仅供学习交流使用,引用请注明出处!谢谢~

来源:数通畅联

相关推荐