Spark系列之分布式数据集-DataFrame

目录: 1、DF的创建 2、临时表 3、SQL查询 4、RDD到DF的转换 5、DF的API 简介 DataFrame是a56爆大奖在线娱乐不可变的分布式数据集,数据被组织成指定的列。和数据库中的表类似。 以下的spark变量均由SparkSession创建。 1、DataFrame的创建 jsonDf = spa
posted @ 2020-07-30 22:33  Wind_LPH  阅读(427)  评论(0编辑  收藏  举报