我正在尝试将文本文件的行读入python中的列表或数组。我只需要在列表或数组创建后能够单独访问它。
文本文件的格式如下:
0,0,200,0,53,1,0,255,...,0.
其中...
如上所述,实际文本文件中有数百或数千个以上的项目。
我使用以下代码尝试将文件读取到列表中:
text_file = open("filename.dat", "r")
lines = text_file.readlines()
print lines
print len(lines)
text_file.close()
我得到的输出是:
['0,0,200,0,53,1,0,255,...,0.']
1
显然,它将整个文件读取到一个只有一个项目的列表中,而不是单个项目的列表中。我做错了什么?
发布于 2013-02-04 03:29:11
您必须使用以下命令将字符串拆分为一个值列表split()
所以,
lines = text_file.read().split(',')
编辑:我没有意识到这会有这么大的吸引力。这里有一种更惯用的方法。
import csv
with open('filename.csv', 'r') as fd:
reader = csv.reader(fd)
for row in reader:
# do something
发布于 2013-02-04 18:46:56
您还可以使用numpy loadtxt,如下所示
from numpy import loadtxt
lines = loadtxt("filename.dat", comments="#", delimiter=",", unpack=False)
发布于 2014-11-21 01:47:25
所以你想创建一个列表列表...我们需要从一个空列表开始
list_of_lists = []
接下来,我们逐行读取文件内容
with open('data') as f:
for line in f:
inner_list = [elt.strip() for elt in line.split(',')]
# in alternative, if you need to use the file content as numbers
# inner_list = [int(elt.strip()) for elt in line.split(',')]
list_of_lists.append(inner_list)
一种常见的用例是列数据,但是我们的存储单元是文件的行,我们已经逐个读取了这些行,因此您可能希望转置你的列表。这可以通过下面的习惯用法来实现
by_cols = zip(*list_of_lists)
另一种常见用法是为每列指定一个名称
col_names = ('apples sold', 'pears sold', 'apples revenue', 'pears revenue')
by_names = {}
for i, col_name in enumerate(col_names):
by_names[col_name] = by_cols[i]
这样您就可以对同构数据项进行操作
mean_apple_prices = [money/fruits for money, fruits in
zip(by_names['apples revenue'], by_names['apples_sold'])]
我所写的大部分内容都可以使用csv
模块,来自标准库。另一个第三方模块是pandas
,这使您可以自动化典型数据分析的大多数方面(但有许多依赖项)。
更新在Python 2中zip(*list_of_lists)
返回一个不同的(转置的)列表列表,在Python 3中,情况已经改变zip(*list_of_lists)
返回zip对象这是不可订阅的。
如果你需求可以使用的索引访问
by_cols = list(zip(*list_of_lists))
这为您提供了两个版本的Python中的列表。
另一方面,如果你不需要索引访问,您想要的只是构建一个按列名索引的字典,一个zip对象就可以了……
file = open('some_data.csv')
names = get_names(next(file))
columns = zip(*((x.strip() for x in line.split(',')) for line in file)))
d = {}
for name, column in zip(names, columns): d[name] = column
https://stackoverflow.com/questions/14676265
复制相似问题