Spark 向量化加速引擎 Blaze 的技术实现与应用案例 导读spark 是大数据业内最常用的分布式数据引擎之一,广泛运用于数据清洗、数仓建设、报表分析、机器学习等领域。当前快手数据平台上绝大多数例行作业为 Spark SQL 作业, 每天例行计算数十万个 SQL,处理数据量达到 EB 级别,使用计算资源数百万 CU 应用 udf blaze orc 引擎blaze 2025-03-09 17:00 5