gravitino

Spark流水线+Gravitino+Marquez数据血缘采集

•OpenLineage是一个开放标准和框架,用于跨工具、平台和系统捕获数据血缘信息。• 它定义了通用的数据血缘模型和API,允许不同的数据处理工具(如ETL、调度器、数据仓库)以标准化格式生成血缘元数据。• 由Linux基金会托管,社区驱动,支持广泛的集成。

血缘 marquez gravitino spark流水线 2025-06-08 23:18  3

Apache Gravitino:数据湖治理新范式

导读在大数据和 AI 时代,统一元数据管理解决方案在数据治理中扮演着关键角色,Apache Gravitino 提供了元数据管理的新范式。通过统一命名、权限、血缘等机制,提升了数据使用和治理效率,尤其在 Iceberg 数据湖架构中展现出优势。Apache G

范式 ic apache catalog gravitino 2025-06-07 09:00  3