我有一列数字的电火花数据。我需要对该列进行求和,然后在python变量中将结果作为int返回。
df = spark.createDataFrame([("A", 20), ("B", 30), ("D", 80)],["Letter", "Number"])我做下面的总结这一栏。
df.groupBy().sum()但我得到了一份数据。
+-----------+
|sum(Number)|
+-----------+
| 130|
+-----------+我会把130作为一个int返回到一个变量中,以便在程序中的其他地方使用。
result = 130发布于 2018-10-28 07:18:40
这是另一种你能做到的方法。使用agg和collect
sum_number = df.agg({"Number":"sum"}).collect()[0]
result = sum_number["sum(Number)"]https://stackoverflow.com/questions/47812526
复制相似问题