我想用python编写hive udf来解析name列(使用https://pypi.python.org/pypi/nameparser),并将解析后的值放入表的不同列(标题、第一列、中间列、最后列、后缀列、昵称列)。
我是python的新手,我写的python代码如下
#!/usr/bin/python
import sys
from nameparser import HumanName
name = HumanName(name)
return name.title
在蜂巢里我是这样做的
add file title.py;
SELECT TRANSFORM (name) using 'title.py' AS (title STRING) from emp2;
但是我得到了org.apache.hadoop.hive.ql.metadata.HiveException.
发布于 2014-12-07 21:13:18
在select语句using子句中,需要指定'python title.py‘而不是title.py。
add file title.py;
SELECT TRANSFORM (name) using 'python title.py' AS (title STRING) from emp2;
https://stackoverflow.com/questions/26979369
复制相似问题