我正在亚马逊EMR实现之上运行一个python脚本。因此,从主脚本中,我得到了条目的相似性。在事后处理步骤中,我希望将这个输出分割为每个项目的单独的S3桶,因此每个项目-桶包含一个类似于它的项目列表。为了实现这一点,我希望在善后步骤的减缩函数中使用Amazons boto python库。
如何将外部(python)库导入hadoop,以便在用python编写的缩减步骤中使用?
每次数字增加到200,我想运行一个特定的代码。Atm我的代码看起来类似于这样:
if(number == 200 || number == 400 || number == 600 || number == 800 || number == 1000问题:如何(如果可能的话)检查变量是否等于这个特定数学顺序中的所有值(每200个数字)。