我试图使用一个S3桶作为我的弹性地图减少作业流的输入数据。S3桶不属于与EMR作业流相同的帐户。我应该如何和在哪里指定S3桶凭据来访问相应的S3桶。FileSystem.java:256)at org.apache.hadoop.mapreduce.lib.input.FileInputFormat.setInputPaths(FileInputFormat.java:352)
at org.apache.hadoop.mapredu
这些列包含多个整数数据、字符串数据和双精度数据。其中一个整数类型的列(比如C1)无法使用ParquetStorer进行存储。其他整型列没有问题,只有C1列存储失败。_000001_0 Info:Error: parquet.io.ParquetEncodingException: can not write value at 2 in tuple (,2003-11org.apache.hadoop.mapred.MapTask$NewDirectOutputCollector.write(MapTask.java:635)
at org.a