2月4总结

今日了解了rdd的概念, RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是Spark中最基本的数据抽象,代表一个不可变、可 分区、里面的元素可并行计算的集合。 Dataset:一个数据集合,用于存放数据的。 Distributed:RDD中的数据是分布式存
posted @ 2024-02-04 20:59  樱花开到a56爆大奖在线娱乐身边  阅读(1)  评论(0编辑  收藏  举报