(func)
应用于(K,V)键值对的数据集时,返回一个新的(K,V)形式的数据集,其中每个值是将每个Key传递到函数func中进行聚合后的结果。...reduceByKey(func)的功能是,使用func函数合并具有相同键的值,(a,b) => a+b这个Lamda表达式中,a和b都是指value,比如,对于两个具有相同key的键值对(“spark...groupByKey()的功能是,对具有相同键的值进行分组。...5,1))
(spark,(4,1))
(hadoop,(7,1))
reduceByKey(func)的功能是使用func函数合并具有相同键的值。...这里的func函数就是Lamda表达式(x,y) => (x._1+y._1,x._2 + y._2),这个表达式中,x和y都是value,而且是具有相同key的两个键值对所对应的value,
scala