概述
在Hive中,用户可以自定义一些函数,用于扩展HiveQL的功能,这类函数分为三大类:
UDF(User-Defined-Function)
特点:一进一出;
继承UDF类(org.apache.hadoop.hive.ql.exec.UDF...)
UDF(User-Defined-Function)
内置的UDF,一般分为两类,UDF、 GenericUDF....相比于UDF,GenericUDF有两个优势
可以接受复杂的参数类型,返回复杂类型
可以接受变长参数个数(参数数组)
extends UDF
UDF类型的编写相对比较简单,父类源码github位置,简易示例如下...UDAF(User-Defined Aggregation Function)
UDAF 是 Hive 中用户自定义的聚合函数,内置的 UDAF 有 max() 等....UDAF的运行流程简介
抽象类GenericUDAFEvaluator中,包含一个静态内部枚举类,和一系列抽象方法.这个枚举类的注释中,解释了各个枚举值的运行阶段和运行内容.按照时间先后顺序,分别有: