我是MinIo的新手,我正在使用minio python库,并尝试将熊猫数据帧保存为CSV。根据这些文档,我正在使用将数据插入到远程云位置。下面是我的代码。
from minio import Minio
from minio.error import ResponseError
from io import StringIO, BytesIO
import pandas as pd
import os
minioClient = Minio('mydomain.com',
access_key='my_access_key',
我有一个很大的csv文件(数据集),大小为443,00KB。该照片显示了该文件的示例。我希望将行保存到另一个数据帧中。我试过这种方法,但花了太多时间。 import pandas as pd
df = pd.DataFrame()
for chunk in pd.read_csv("UsersVle.csv", chunksize=10):
for i, row in chunk.iterrows():
if((row['module']=='D3') & (row['presentation']
我对Python中的Panda dataframe非常陌生。我正在编写一段代码,其中的csv文件结构如下: Id, Title, Body, Tags, Date
1, First question, My first question, robot Python, 2015
2, Second question, My second question, C++ Python, 2015
3, Third question, My third question, Selenium, 2016
4, Fourth question, My fourth question, Java C++,
我有一个很大的数据帧(大约500万行),其中包含一些错误的数据。我已经识别了具有错误数据的行的索引,现在我正在尝试从数据帧中删除“错误”的行。 由于数据帧的大小,我在读取csv时使用了chunksize功能。为了跳过“错误”的行,我使用了skiprows和error_bad_lines features。我还使用low_memory特性来防止警告(出于示例的目的,我只读取了前20000行)。然后,我将新数据帧保存在新的csv中。 问题是,只有前9个“错误”行被跳过,然后“错误行”仍然被读取(并保存到输出csv)。 下面是我的代码: for df in pd.read_csv('dat