我有 Spark Scala 的问题,我想计算 Rdd 数据的平均值,我创建一个像这样的新 RDD,
[(2,110),(2,130),(2,120),(3,200),(3,206),(3,206),(4,150),(4,160),(4,170)]
我想这样数它们
[(2,(110+130+120)/3),(3,(200+206+206)/3),(4,(150+160+170)/3)]
然后,得到这样的结果,
[(2,120),(3,204),(4,160)]
我如何使用 RDD 中的 scala 来做到这一点?
我用的是spark 1.6版本