Spark Action算子简介-365网新闻-365网新闻-365eme-mobile.allsport365

collect() / collectAsMap()

stats / count / mean / stdev / max / min

// 返回统计信息。仅能作用 RDD[Double] 类型上调用

val rdd1 = sc.range(1, 101)

rdd1.stats

val rdd2 = sc.range(1, 101)

// 不能调用

rdd1.zip(rdd2).stats

// count在各种类型的RDD上，均能调用

rdd1.zip(rdd2).count

reduce(func) / fold(func) / aggregate(func)

scala> rdd1.reduce(_+_)

res39: Long = 5050

scala> rdd1.fold(1)(_+_)

res41: Long = 5063

## 定义初值 1，每个分区局部汇总+初值，全局汇总+初值加了13次

scala> rdd1.getNumPartitions

res42: Int = 12

scala> rdd1.aggregate(1l)(_+_,_+_)

res44: Long = 5063

first()：Return the first element in this RDD

take(n)：Take the first num elements of the RDD

top(n)：按照默认（降序）或者指定的排序规则，返回前num个元素。

scala> rdd1.first

res46: Long = 1

scala> rdd1.take(5)

res47: Array[Long] = Array(1, 2, 3, 4, 5)

scala> rdd1.top(5)

res48: Array[Long] = Array(100, 99, 98, 97, 96)

takeSample(withReplacement, num, [seed])：返回采样的数据

scala> rdd1.takeSample(true, 4)

res50: Array[Long] = Array(86, 86, 56, 99)

scala> rdd1.takeSample(false, 4)

res51: Array[Long] = Array(91, 34, 18, 52)

foreach(func) / foreachPartition(func)：与map、mapPartitions类似，区别是 foreach 是 Action

scala> rdd1.foreach(x => println(x))

....

saveAsTextFile(path) / saveAsSequenceFile(path) / saveAsObjectFile(path)

scala> rdd1.saveAsTextFile("/aa/x.txt")

Spark Action算子简介

相关推荐

109梦幻西游天宫的心得（平民与土豪的发展路线）

圣杯王牌塔罗牌：2025年象征和意义的完整指南

凯瑞是什么车呢？

22、电脑数字键盘上下左右能用数字不能用的情况之

兰妃鸡蛋（6只，每周三、周日配送）

小米手机开启Google Play 教程 (亲测有效)

电脑剪辑视频软件有哪些？这6款剪辑软件值得选择

BomBax EZ100 矿机 12500Mh/s 2500W Etchash/ETC/ETHW/ETF/ZIL

偷星九月天

你从何处而来，要到何处去？

回顾2016年世界杯决赛：德国与阿根廷的巅峰对决

灰色为什么高档色系（“灰色”凭什么高级？）

友情链接