在这种情况下,我正在努力弄清楚如何使用MIN()函数。我有以下的Pig脚本: A = LOAD '/home/mqp/Documents/p1/data/test_customers.csv' USING CSVExcelStorage (',') ASsinglesal), COUNT(C), SUM(transtotal), flatten(mintotals);
STORE out INTO '/home/mqp
A = LOAD 'raw.people1' using org.apache.hive.hcatalog.pig.HCatLoader();C = COGROUP A BY (name, place, animal, thing) , B BY (name但是D失败了,错误:未能解析:语法错误,意外的符号
我使用Pig处理多列数据。Pig使用HCatalogLoader在pig脚本中加载数据。这些列包含多个整数数据、字符串数据和双精度数据。其中一个整数类型的列(比如C1)无法使用ParquetStorer进行存储。其他整型列没有问题,只有C1列存储失败。(ParquetStorer.java:121)
at org.apache.pig.backend.hadoop.execution
错误2229:无法为项目找到匹配的uid -1 (名称:项目类型:字节数组Uid:-1输入:0列: 12)
at org.apache.pig.PigServer.compilePp(PigServer.java:1324)
at org.apache.pig.PigServer.executeCompiledLogic