Apache Hudi典型应用场景知多少?

1.近实时摄取 将数据从外部源如事件日志、数据库提取到 "Hadoop数据湖" 中是一个很常见的问题。在大多数Hadoop部署中,一般使用混合提取工具并以零散的方式解决该问题,尽管这些数据对组织是非常有价值的。 对于RDBMS摄取,Hudi通过Upserts提供了更快的负载,而非昂贵且低效的批量负载
posted @ 2020-05-19 18:49  leesf  阅读(2835)  评论(0编辑  收藏  举报