我认为我的加入和过滤器是正确的,但我不能计算出不同的计数部分已经尝试了下面的许多版本。a = load '/user/pig/movie' AS (userid:int, movieid:int, rating:int, timestamp:chararray);
b = load '/user/pig/reviewer' using PigStorage('|') AS (userid:int, age
代码和错误:
grunt> STORE logs INTO '/home/cloudera/workspace/Test_log.csv' USING org.apache.pig.piggybank.storage.CSVExcelStorage10:50:49,056主要信息org.apache.pig.data.SchemaTupleFrontend -设置带反序列化类的关键pig.schematuple.clas
我正在尝试使用ApachePig拉丁语在2019年12月1日(来自)找出下载量最大的5个RStudio包。我需要的列是'r_os‘和'package’。下面是我的代码:
A = load '2019-12-01.csv' USING org.apache.pig.piggybank.storage.CSVExcelStorage(',', 'NO_MULTILINE', 'UNIX', 'SKI