技术应用 | 基于Flink+Hudi的实时数据湖建设
目前商业银行数据仓库主要采用基于MPP(Massively Parallel Processing)架构的离线数据存储计算方式,离线数仓的数据源主要以文件形式提供,由统一批量采集传输原始数据至客户端服务器,对数据进行清洗、转换、加载至MPP数据库贴源层,然后再
目前商业银行数据仓库主要采用基于MPP(Massively Parallel Processing)架构的离线数据存储计算方式,离线数仓的数据源主要以文件形式提供,由统一批量采集传输原始数据至客户端服务器,对数据进行清洗、转换、加载至MPP数据库贴源层,然后再
最近,Apache 软件基金会宣布 Apache Hudi 1.0 正式发布。这是一个支持近实时分析的事务型数据湖平台,最初于 2017 年推出。Apache Hudi 提供了一种做过专门优化的开放式表格式,可实现增量数据管道的高效写入,提供可靠的查询性能。
apache hudi apachehudi 2025-01-24 14:41 12
Apache Hudi 1.0.0 是 Apache Hudi 的一个重要里程碑版本。此版本包含重要的格式更改和令人兴奋的新功能。
apache hudi apachehudi 2024-12-17 10:47 13