前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >用户自定义函数UDTF

用户自定义函数UDTF

作者头像
十里桃花舞丶
发布2021-09-10 11:13:37
4140
发布2021-09-10 11:13:37
举报
文章被收录于专栏:桥路_大数据桥路_大数据

SQL DDL:用户自定义函数UDTF

UDTF开发要点

Hive UDTF只有一种实现方式,需要继承org.apache.hadoop.hive.ql.udf.generic.GenericUDTF类,并重写initialize, process, close三个方法。

这三个方法的具体描述为:

接口方法

返回类型

描述

initialize

StructObjectInspector

初始化,一般用于检查参数个数和类型,初始化解析器,定义返回值类型

process

void

实现具体的数据处理过程,通过forword()方法把结果返回

close

void

进行清理工作

forward

void

将输出行传递给收集器

因为UDTF是将一行数据拆分为多行,所以在处理过程中按照一定规则拆分出的每一行数据,在遍历过程中,会交由forward方法传递给收集器,从而完成多行数据的生成。

UDTF开发案例

字符串拆分

案例描述

现在通过一个案例,来进行UDTF开发实践。

具体要求为:实现个人信息的字符串拆分,拆分为多行,并解析成name、age字段。

案例数据为&#x

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2021-08-18 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • SQL DDL:用户自定义函数UDTF
    • UDTF开发要点
      • UDTF开发案例
        • 字符串拆分
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档