Pandas read_csv未读取文件中的所有行

文章/答案/技术大牛

发布

1回答

、、

我正在尝试读取与熊猫的csv文件。文件的标题后面有14993行。data = pd.read_csv(filename, usecols=['tweet', 'Sentiment']) print(len(data)) 它打印: 14900，如果我添加一行到文件的末尾，它现在是14901行，所以这不是因为内存限制等，我也尝试了"error_bad_lines“，但没有

浏览 15提问于2019-03-04得票数 1

2回答

Pandas -有没有可能在没有报价的情况下使用read_csv？

、、

我正在尝试读取一个csv文件，该文件在某些行中包含单个"实例，例如：jet,ski,"hat我尝试设置quotechar=No

浏览 0提问于2015-02-03得票数 26

回答已采纳

1回答

熊猫: read_csv()方法:字符串长度限制

、、

我有一个有数百万行(26 of )的文件。但是第二行有2300万个b'\x00'符号(NUL)。当我从文件中读取到DataFrame时，它无法读取第二行，因此我只收到一行。是否有可能用read_csv方法读取所有数据？：1.3.5和1.1.4版本的Pandas有什么区别吗？令人惊讶的是，它使用1.1.4版本

浏览 2提问于2022-07-27得票数 0

1回答

未实现read_excel的parse_dates关键字

、

当我读取excel文件时，我得到以下错误："NotImplementedError: read_excel的parse_dates关键字未实现“。我在使用read_csv时没有得到这个错误calendar = p.read_excel('../data/testdates.xlsx', parse_dates=['date']) 我使用的是python: 3.6

浏览 1提问于2017-11-16得票数 0

1回答

当CSV内容读取为列表时，pandas read_csv()返回带有.1和.2的重复条目

、

我正在使用pandas read_csv()方法将CSV文件的第一行读入列表，如下所示。想象一下，expected_columns="NewYork"，“悉尼” 现在，目标CSV文件也具有相同的列，如"NewYork“、"Sydney”、"Sydney“、"Sydney”。如上所述，当我使用Pandas read_csv()读取CSV时，它将CSV文

浏览 2提问于2021-07-15得票数 1

3回答

Pandas -只读每行的前几行

、、、

我有一个很大的CSV文件，其中包含大约10000行文本信息，数据集中的每一行都由许多行组成。但是，我只想读取CSV文件中每一行的前20行。我在pandas read_csv方法中遇到了n_rows参数，它可以帮助我们限制要加载的数据集的行数。有没有一种方法，我们只能从pandas中</

浏览 33提问于2020-06-03得票数 0

回答已采纳

1回答

将包含每列值的标题行添加到多个CSV文件

、、、

我在一个目录中有多个CSV文件，但是没有头文件。我正在寻找一种健壮的方法，一次向我目录中的所有文件添加相同的头文件。quantity John Doe Guitar 4 units 到目前为止，我找到了一种方法，可以使用pandas将头文件添加到单个文件中： from pandas importread_csv

浏览 17提问于2020-02-02得票数 0

回答已采纳

2回答

pandas read_csv导入为列提供了混合类型

、

我有一个包含130,000行的csv文件。使用pandas的read_csv函数读取文件后，其中一列(“CallGuid”)具有混合对象类型。["CallGuid"][32767]Out[11]: u'4129259051' 所有行<=

浏览 0提问于2014-08-27得票数 13

10回答

AttributeError:模块“pandas”没有属性“”read_csv“”Python3.5

、、

我已经成功地使用pandas.read_csv很长时间了，但是当我尝试读取csv文件时，它突然开始给出错误AttributeError: module 'pandas' has no attribute 'read_csv' 我试过升级熊猫，但不起作用。我试图搜索并得到，但当我在我的熊猫中搜

浏览 6提问于2017-04-29得票数 11

1回答

将CSV文件拆分为两个文件，在两个文件中保留标头

、

我正在尝试将一个大的CSV文件拆分为两个文件。我正在使用下面的代码 import pandas as pd in_csv = 'Master_file.csv' chunksize=rowsize)#size of data to append for each loop 它正在拆分文件，但它在第二

浏览 23提问于2021-10-14得票数 0

1回答

pandas read_csv()从CSV内容返回带有.1和.2的重复条目

、、

我正在使用pandas read_csv()方法将CSV文件的第一行读入列表，如下所示。imagine, expected_columns=["NewYork","Sydney","Sydney","Sydney"] 现在，目标CSV文件也具有相同的列，如"NewYork“、"Sydney如上所述，当我使用Pandas read_csv

浏览 3提问于2021-07-23得票数 0

1回答

熊猫读取带有可变行的CSV文件，以跳过行首的特殊字符。

、、

当使用熊猫read_csv方法读取CSV文件时，如果事先不知道行数，如何跳过这些行？ # Meta-Data Line 1#

浏览 5提问于2017-01-30得票数 6

回答已采纳

2回答

如何使用pandas从csv读取特定列索引

、、

有没有办法使用Pandas(最好是read_csv)从csv文件中只读取具有特定索引的特定列？我知道read_csv提供了按列名读取特定列的能力，但是数据文件没有标题，所以我不能使用列名。注意，文件太大了，所以我不想读入整个文件，然后再读入子集。谢谢。

浏览 0提问于2015-09-07得票数 4

1回答

Pandas read_csv中的复杂定界列

、、

我正在尝试使用Pandas读取一些日志文件，其中列由空格分隔，一些列由带空格的单引号字符串组成(例如'string ')。我很难用read_csv读取这些文件。例如(使用一些虚拟数据)：from io import StringIO 1 2 'asdf '""

浏览 12提问于2018-01-19得票数 2

回答已采纳

1回答

使用Pandas为Elasticsearch创建带有嵌套对象的JSON文件时，空白值处理

、

Python 3.9.5/Pandas 1.1.3{ "

浏览 2提问于2021-09-14得票数 0

回答已采纳

1回答

如何从python中的csv文件中删除不需要的数据

、

(sea_level_df)#title = mean sea level anomaly global ocean (66S to 66N) (Annual signals retained) 1993.0123,-14.87000,1993.0660,-2

浏览 7提问于2022-10-17得票数 0

回答已采纳

1回答

如何使用pandas并行读取.xls？

、、

我想用pandas并行读取一个大的.xls文件。目前我使用的是：CHUNKSIZE = 100000 # processing 100,000 rows at a time result += f.get(timeout=10) # timeout in 10 seconds 虽然这样运行，但我不认为它实际上加快了读取</e

浏览 0提问于2015-07-22得票数 5

4回答

可以分块读取拼图文件吗？

例如，pandas的read_csv有一个chunk_size参数，它允许read_csv在CSV文件上返回一个迭代器，这样我们就可以分块读取它。拼图格式以块的形式存储数据，但是没有像read_csv这样的有文档记录的方法来读入块。有没有办法以块的形式读取拼图文件？

浏览 3提问于2019-11-29得票数 8

4回答

如何从CSV文件中拉出一行？

我知道有类似的问题已经得到了回答，但我还没有发现任何不建议使用pandas、lists或enumerate的问题，所有这些我都不能使用。FILE = 'internet_access.csv' with open(FILE, 'r') as infile:totals = read_cs

浏览 2提问于2021-10-18得票数 0

3回答

将大型数据集加载到Pandas* Python中*

、、

我想从InstaCart 加载大型.csv (340万行，206k用户)开源数据集基本上，我在将orders.csv加载到Pandas DataFrame时遇到了问题。我想学习将大文件加载到Pandas/Python中的最佳实践。

浏览 3提问于2017-06-14得票数 1

点击加载更多