有三种自定义函数:UDF、UDAF、UDTF。
UDF(User-Defined-Function):一进一出。trim
UDAF(User-Defined Aggregation Funcation):多进一出。count/max/min
UDTF(User-Defined Table-Generating Functions) :一进多出。lateral view explore()
创建自定义UDF函数步骤:
(1)在eclipse中自定义类,继承UFD类,重写evaluate()方法;
(2)方法接收一个类型的数据,返回另一个类型的数据,编写方法体;
(3)将该类打成jar包,上传至Linux系统中;
(4)输入hive客户端命令,将jar包导入hive中:add jar …jar;
(5)输入hive命令,添加函数:create temporary function 函数名 as ‘com.bjsxt.hive.TuoMi’;
注意:该函数使用temporary修饰,表示是临时函数,仅在当前hive客户端会话窗口中有效。
匿名回答于2024-06-04 09:18:14