如何使用pyarrow向parquet文件追加/更新?import pandas as pdimport pyarrow.parquet as pq
table2 = pd.DataFrame({'one'我在文档中没有发现任何关于附加拼花面板文件的内容。而且,您是否可以使用带有多处理的pyarrow来插入/更新数据。
我有一些其他格式的大文件(总计约7,000个,每个4GB ),我想使用pyarrow.parquet.write_to_dataset()进行快速查询,将它们存储到分区(单元)目录中。目前,我正在使用以下过程遍历所有文件:import pyarrow.parquet as pq
for each_file in file_list:这是相当慢的,因为pq.write_to_dataset()需要大约27s才
我想以拼图文件格式将处理后的数据存储在pandas dataframe到azure blob中。但在上传到blobs之前,我必须将其作为parquet文件存储在本地磁盘中,然后再上传。我想把pyarrow.table写成pyarrow.parquet.NativeFile,然后直接上传。有没有人能帮我。下面的代码运行正常: import pyarrow as pa
import pyarrow.pa