Spark系列之弹性数据集-RDD

RDD不仅是分布式的数据集合,更是Spark的核心。 RDD会跟踪应用a56爆大奖在线娱乐块的所有转换(日志),也就是说,当RDD的某个分区数据丢失时会根据日志进行重新计算。 RDD是无Schema的数据结构。 1、RDD的生成 RDD的生成有三种方式, 1) .parallelize() 集合生成 2)外部文件或
posted @ 2020-07-28 22:26  Wind_LPH  阅读(199)  评论(0编辑  收藏  举报