文章/答案/技术大牛

发布

社区首页 >问答首页 >如何在PySpark中定义用户定义的聚合函数？

问如何在PySpark中定义用户定义的聚合函数？
EN

Stack Overflow用户

提问于 2022-09-22 15:36:22

回答 1查看 36关注 0票数 0

我想要使一个用户定义的聚合函数在吡火花。我为Scala找到了一些文档，并希望在Python中实现类似的功能。

更确切地说，假设我已经实现了这样一个函数：

def process_data(df: pyspark.sql.DataFrame) -> bytes:
  ...  # do something very complicated here

现在我希望能做这样的事情：

source_df.groupBy("Foo_ID").agg(UDAF(process_data))

现在的问题是-我应该用什么来代替UDAF

python

apache-spark

pyspark

aggregate-functions

user-defined-functions

回答 1

Stack Overflow用户

发布于 2022-09-23 15:10:05

PySpark不直接支持，因此我们必须手动进行聚合。

参考：

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/73817326

复制

相似问题

问如何在PySpark中定义用户定义的聚合函数？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何在PySpark中定义用户定义的聚合函数？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何在PySpark中定义用户定义的聚合函数？
EN