大数据学习:Spark知识总结
Spark一、Spark基础及安装(单机)二、Spark核心组件、运行架构及RDD创建三、Spark的RDD算子操作四、Spark算子:Java版本(map、flatMap、distinct、subtract、combineByKey等)五、RDD算子:reduceByKey、foldByKey、SortByKey六、Spark算子:groupByKey、cogroup、subtractByKey
·
Spark
四、Spark算子:Java版本(map、flatMap、distinct、subtract、combineByKey等)
五、RDD算子:reduceByKey、foldByKey、SortByKey
六、Spark算子:groupByKey、cogroup、subtractByKey、join
七、Spark文件保存到本地或HDFS:saveAsTextFile和saveAsObjectFile
八、Spark RDD算子:分区操作,mapPartitions和mapPartitionsWIthIndex
九、Spark RDD算子:RDD分区,HashPartitioner、RangePartitioner、自定义分区
十一、Spark加载CSV和JSON文件(附在虚拟机中执行jar包)
十三、Spark SQL操作外部数据源(Parquet、Hive)
十五、Spark SQL:MySQL经典50题(SQL版和Spark版)
十八、Graph图的算子(subgraph、joinVertices、outerJoinVertices),PageRank算法
更多推荐
所有评论(0)