我在PySpark中使用PySpark( Python ),下面是我的代码的开头(注意,我实际上是通过与PySpark交互的shell来运行这一切的)。" GROUP BY "username"')对于所有行,我得到的输出都是这样的:
(u'Username', <jpype._jclass.java.lang.Long object at 0x25d1e10>)
我有一个自定义的hive来访问Maxmind的GeoIP-country.mmdb数据库,该数据库通过"add pqr.mmdb“添加到单元资源中。当我运行一个单元查询时,编译的UDF被添加为"add abc.jar“,在后台java类试图访问geo数据库中的数据,但是抛出以下异常失败。run(URLClassLoader.java:366)
at ja