与熊猫一起读取csv时“skiprows”的问题_用不同截面读取复杂CSV时的问题_读取csv文件中的索引列时出现问题 - 腾讯云开发者社区

由于数据帧的大小，我在读取csv时使用了chunksize功能。为了跳过“错误”的行，我使用了skiprows和error_bad_lines features。我还使用low_memory特性来防止警告(出于示例的目的，我只读取了前20000行)。然后，我将新数据帧保存在新的csv中。问题是，只有前9个“错误”行被跳过，然后“错误行”仍然被读取(并保存到输出csv</em

浏览 14提问于2020-09-25得票数 0

回答已采纳

1回答

我是如何用很多分隔符来转换csv的

、、、、

我的数据集(国民收入)：如何找到数据集的分隔符，因为我试图使用熊猫库读取dataset csv文件，但我已经尝试了逗号(，)、分号(;)、制表符(\t)、空格()和管道(\ )，但它仍然没有工作我也尝试过df=pd.read_csv("file name", sep='delimiter')，但它仍然不起作用。有人帮我吗，我该怎么办？

浏览 5提问于2022-06-15得票数 2

回答已采纳

1回答

熊猫-块之间重叠的块read_csv

、、

问题陈述例如，假设列表indexes表示我希望阅读的某些数据的索引。3,4,5,6,7], [6,7,8,9]] # iteratively read in indexes sets with overlap size 2我有一个使用skiprows和nrow的黑客解决方案，但是当它读取csv<

浏览 3提问于2020-04-29得票数 1

1回答

Python命令行参数文件名

我有一个脚本，它首先读取与熊猫有关的表数据，然后进行计算：import sysoriginaldata = pd.read_csv(rest of the code) 我希望在命令行中传递文件名，而不是每次有不同的文件时在代码中输入它。我的代码正确吗？('filename', sep='\t', skiprows

浏览 5提问于2015-11-17得票数 3

回答已采纳

3回答

熊猫:从csv文件中获取数据，而不管头部位置如何

、、、

我有csv文件，我必须用来制作和panda。-12-20 419256 44592 139612012-12-22 200992 18840 5170SomeName ABCD Report Author: Analysis31014 2012-12-23 321891 619

浏览 3提问于2014-09-17得票数 3

回答已采纳

2回答

跳过未知数量的行来读取头蟒熊猫

、

我有一个excel的数据，我读到与蟒蛇熊猫：data = pd.read_csv('....在本例中，数据包含3条垃圾行(我不想在其中阅读)，然后点击标题，有时包含4条或更多的垃圾行。因此，在这个例子中，我从数据中看到：数据看起来如下： ID

浏览 9提问于2015-12-01得票数 12

回答已采纳

7回答

如何在没有第一列的情况下读取CSV

、、

我试图像下面这样读取一个简单的CSV文件，并将其内容放在一个2D数组中： "","x","y","sim1","sim2","sim3","sim4","sim5","sim6","sim7","sim8181180,333700,6.16541910171509,6.44704437255859,7.51744651794434,5

浏览 7提问于2013-10-02得票数 40

回答已采纳

1回答

为什么并行阅读大型CSV时节省的时间很小？

、、

我正在测试使用熊猫和Python多处理模块同时读取一个大型CSV文件的可能性。 df = pd.read_csv(INFILE, skiprows=skiprows, nrows=

浏览 2提问于2019-08-07得票数 1

回答已采纳

6回答

csv导入熊猫期间跳过行

、、、

我试图使用.csv导入一个pandas.read_csv()文件，但是，我不想导入数据文件的第二行(索引为0的行=1)。我看不出如何不导入它，因为与命令一起使用的参数看起来很模糊：要跳过的行号(0-索引)或文件开头要跳过的行数(int)。“ 如果我将skiprows=1放在参数中，它如何知道是跳过第一行还是跳过索引1

浏览 4提问于2013-12-17得票数 128

回答已采纳

1回答

使用glob、os读取使用熊猫的csv文件时出错

、

我试图在一个目录中读取多个csv文件，使用熊猫。我用了两种方法，两种方法都没用。')): print(qu)for filename in os.listdir(

浏览 0提问于2018-03-30得票数 0

回答已采纳

1回答

读取CSV文件时合并重复列

、

给定一个包含重复列A的CSV文件，我需要读取不包括重复列的文件-306 306 5064159 4159366可供选择的选项包括usecols和names。但是，在Pandas version 0.24.1中，我们也有mangle_dupe_cols参数，如果设置为False，就会合并中提到的重复列。但是，当我这么做的时候，

浏览 0提问于2019-03-04得票数 6

1回答

熊猫读取带有可变行的CSV文件，以跳过行首的特殊字符。

、、

当使用熊猫read_csv方法读取CSV文件时，如果事先不知道行数，如何跳过这些行？ # Meta-Data Line 1#

浏览 5提问于2017-01-30得票数 6

回答已采纳

3回答

如何从python中的文本文件中读取特定行

、

我试图制作一个游戏，要求我从python3.6中的文本(.txt)文件中读取特定的行。如果我只想打印这条线的话，我已经想出了一个方法。我不知道我做错了什么，在我的研究中也没有发现任何东西。

浏览 0提问于2018-05-18得票数 0

回答已采纳

1回答

如何导入非均匀CSV文件的特定部分

、、

我试图从包含生理数据的csv文件中提取一些数据。当我在excel中打开CSV文件时，它的形状并不是完全一致的，这就是我读取它的方式。相反，它作为多个不同的表读入人眼。我已经包括了和文件的图片我只需要从csv文件的一个主要表中获取数据，，但我在文件中读取数据时遇到了困难，无法获得正确的熊猫数据。我尝试将导入中<

浏览 0提问于2019-08-21得票数 1

回答已采纳

5回答

熊猫分析csv错误-预期1字段发现9

、、、、

我试图从一个.csv文件中解析：但我总是以这样的错误告终：我的csv文件的前几行如下所示：#pl_hostname

浏览 1提问于2018-04-03得票数 2

回答已采纳

1回答

将.dat文件导入到dataframe，而不是python中的字符串列表

、

我正在尝试导入一个.dat文件，该文件是从我的实验中输出的，作为头行中的元数据，然后是实验本身的数据(后面是带有破折号的行)。我的想法是去掉它，这样我就有了一个包含元数据的字符串变量列表，还有另一个包含结果(在破折号下面的部分)数据的变量。

浏览 3提问于2017-04-10得票数 0

回答已采纳

1回答

我的csv文件包含600万条记录，我正试图使用skiprows将它分割成多个较小的文件。我的Pandas版本是'0.12.0‘，代码是 pd.read_csv(TRAIN_FILE, chunksize=50000, header=None, skiprows=999999, nrows=你知不知道这是意料之中的事？如果我不使用skiprows，我的nrow可以达到500万条记录。还没试过。也会试试这个。尝

浏览 3提问于2013-11-30得票数 6

1回答

从一个csv文件读取两个完全不同的数据文件

、、、

本质上，读取单个csv文件的所有内容都有问题。csv文件的前几行，包含7 columns.The文件的其余13列。我可以在不同的时间分别阅读，但我想知道是否有一种方法可以立即阅读。一些csv文件的照片；(注意到：您可以忽略为第一个dataframe创建的nans，它们将不需要(只有第一行将被使用)，我只是在这里展示了它们来进行全面的概述) 现在，我试过两次使用熊猫<

浏览 0提问于2019-04-20得票数 1

回答已采纳

1回答

将自定义CSV文件高效地读取到Python中

、、

我尝试了几件事，并尝试了几种基于论坛和其他网页上的建议的方法--所有这些都导致了一个或另一个问题。如果有人能帮助解决这个问题，我们将不胜感激。备注:我已经进口了熊猫作为pdDF = pd.read_csv(FilePath) DF = pd.read_csv(FilPath, skiprows=3) 这也会产生同样的

浏览 6提问于2017-01-22得票数 0

1回答

加载日期介于两者之间的pandas

、

我有一个.csv文件，其中一行包含日期，下面是我想要作为df加载的数据:例如： 2018 - 01 - 14 Heure,Column1, Column2,.....,50 有没有一种方法可以用pandas.read_csv将第一行中的日期添加到date列中？(而不是逐行解析) 谢谢!

浏览 15提问于2019-03-05得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云