这些练习题基本可以在15行代码以内完成,如果遇到困难,建议回看上一节SparkSQL的介绍。
完成这些练习题后,可以查看本节后面的参考答案,和自己的实现方案进行对比。...求每个班级学生年龄的众数。...("class1",15),("class2",16),("class2",16),("class1",17),("class2",19)]
二,练习题参考答案
1,求平均数
#任务:求data的平均值...,若有多个,求这些数的平均值
from pyspark.sql import functions as F
data = [1,5,7,10,23,20,7,5,10,7,10]
dfdata =...求每个班级学生年龄的众数。