我在同一个google云平台上有hdfs集群和python。我想从python访问hdfs集群中的文件。我发现使用pydoop可以做到这一点,但我很难给出正确的参数。下面是我已经尝试过的代码:-import pydoop
pydoop.hdfs.hdfs(host='url of the file system但是这个"vs_co2_all
我在HDFS中有3个LZO压缩文件和它们对应的索引文件。rw-r--r-- alum supergroup 70.54 KB 3 128 MB part-00002.lzo.index1) LZO index files are also being treated as data files and meaningless data appears in hive它在我们的纱线集群中工作得很好。