首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >在Spark-SQL中创建用户定义函数

在Spark-SQL中创建用户定义函数
EN

Stack Overflow用户
提问于 2014-07-30 15:32:55
回答 1查看 24.2K关注 0票数 18

我是spark和spark SQL的新手,我正在尝试使用spark sql查询一些数据。

我需要从一个以字符串形式给出的日期中获取月份。

我认为直接从sparkqsl查询月份是不可能的,所以我在考虑用scala编写一个用户定义的函数。

有没有可能用sparkSQL编写自定义函数,如果可能的话,有没有人能建议写自定义函数的最好方法。

EN

回答 1

Stack Overflow用户

发布于 2017-05-27 03:11:25

在Spark 2.0中,您可以执行以下操作:

代码语言:javascript
复制
// define the UDF
def convert2Years(date: String) = date.substring(7, 11)
// register to session
sparkSession.udf.register("convert2Years", convert2Years(_: String))
val moviesDf = getMoviesDf // create dataframe usual way
moviesDf.createOrReplaceTempView("movies") // 'movies' is used in sql below
val years = sparkSession.sql("select convert2Years(releaseDate) from movies")
票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/25031129

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档