我有一个类似于BytesIO文件的对象,包含一个CSV.我想把它读到Pandas dataframe中,而不需要在中间写入磁盘。在我的用例中,我直接将文件下载到BytesIO中。对于这个MWE,我将在磁盘上有一个文件,将它读入BytesIO,然后读入Pandas。磁盘步骤只是为了制作一个MWE。file.csv1,2剧本:
import pandas a
此代码的目标是从指定的S3桶中读取现有的CSV文件到Dataframe中,过滤所需列的数据,然后使用StringIO将过滤后的数据写入CSV对象,然后将其上传到不同的S3存储桶。下面是完整的代码块:import io #unsued at the momentimport pandas as pd“方法和StringIO编写传递给函数的现有DF的地方,而不是创建本地文件。