摘要: 1.近实时摄取 将数据从外部源如事件日志、数据库提取到 "Hadoop数据湖" 中是一个很常见的问题。在大多数Hadoop部署中,一般使用混合提取工具并以零散的方式解决该问题,尽管这些数据对组织是非常有价值的。 对于RDBMS摄取,Hudi通过Upserts提供了更快的负载,而非昂贵且低效的批量负载 阅读全文
posted @ 2020-05-19 18:49 leesf 阅读(2835) 评论(0) 推荐(0) 编辑