spark系列之基本概念

Spark的架构图 1、RDD(弹性分布式数据集) RDD是对象的分布式集合。 RDD以并行方式应用和记录数据转换 RDD也提供数据沿袭——以图形形式给出a56爆大奖在线娱乐中间步骤的祖先树,当RDD的一个分区丢失,可以根据祖先树重建该分区。 RDD有两组操作,转换(transformation)和行动(actio
posted @ 2020-07-28 21:19  Wind_LPH  阅读(170)  评论(0编辑  收藏  举报