我正在使用PyArrow的HDFSIO库运行一个Dask-YARN作业,它使用PyArrow的HDFSIO库将结果字典转储到HDFS中(代码如下所示)。然而,作业间歇性地遇到如下所示的错误,并不是每次运行,只是偶尔。我无法确定这个问题的根本原因,有人有什么想法吗?/io.pxi", line 72, in pyar
我正在开发一个HDP集群,并试图使用pyarrow从HDFS读取一个.csv文件。我能够连接到hdfs,并使用info()函数打印有关文件的信息。但是当涉及到读取文件的内容时,我会得到一个pyarrow.lib.ArrowIOError.问题的根源是什么?这是我正在执行的代码import pyarrow as paimport