我已经写了一个成功的脚本,用于计算行人所采取的总步数,以及他们的最高步数。我没有得到的是在Pig输出中生成标题,这样输出看起来整洁、干净。是否有任何方法可以在写入输出时生成标头。以下是我的代码,DEFINE CSVLoader org.apache.pig.piggybank.storage.CSVLoaderpart1.hourly_counts);
STORE part3 int
我需要在Pig中加载特定分区(日期)的数据。此数据是在Hive中创建的,并按日期进行了分区。所以我想通过HCatalog在Pig中加载数据。HCatalog文档指出,要在Pig中加载某个分区,首先加载整个数据集,然后对其进行筛选,即:b = filter a by datestamp > '20110924