Apache Hudi:CDC的黄金搭档

1. 介绍 Apache Hudi是一个开源的数据湖框架,旨在简化增量数据处理和数据管道开发。借助Hudi可以在Amazon S3、Aliyun OSS数据湖中进行记录级别管理插入/更新/删除。AWS EMR集群已支持Hudi组件,并且可以与AWS Glue Data Catalog无缝集成。此特性
posted @ 2021-04-06 09:51  leesf  阅读(786)  评论(0编辑  收藏  举报