我有一个只有一列的csv文件。我想提取行数。当我运行以下代码时:
import pandas as pd
df = pd.read_csv('data.csv')
print(df)
我得到以下输出:
[65422771 rows x 1 columns]
但是当我运行下面的代码时:
file = open("data.csv")
numline = len(file.readlines())
print (numline)
我得到以下输出:
130845543
我的csv文件中的正确行数是多少?这两个输出之间的区别是什么?
发布于 2021-02-19 05:09:03
有没有可能在每个条目后都有一个空行?因为readlines
计数恰好是wrt pandas df行的两倍。因此,熊猫跳过空行,而readlines
则对它们进行计数
要检查空行的数量,请尝试:
import sys
import csv
csv.field_size_limit(sys.maxsize)
data= open ('data.csv')
for line in csv.reader(data):
if not line:
empty_lines += 1
continue
print line
https://stackoverflow.com/questions/66268154
复制相似问题