我有一个包含390个行和大约8000列的.txt文件。数据只有1s和0,用空格隔开。我想要计算数字1出现在每一列中的次数(每一列的总总和)。为此,我将使用numpy数组。问题是,我一直在脚本行"b =a.sum(axis=0)“中获得以下错误消息:
"TypeError:不能用灵活的类型执行减缩“
欢迎任何建议!
这是我使用的简单代码:
import csv
import numpy as np
from numpy import genfromtxt
my_data = genfromtxt('test1.txt', dtype='S', delimiter=',')
a = np.asarray(my_data)
import sys
sys.stdout = open("test1.csv", "w")
b = a.sum(axis=0)
print b一个输入示例test1.txt:
1 0 0 0 1 1 0 1
0 1 1 0 1 1 1 1
1 0 0 0 0 1 0 0
0 1 1 0 1 0 1 1预期产出:
2 2 2 0 3 3 2 3发布于 2016-05-17 15:41:34
您会得到该错误,因为您正在使用dtype='S‘导入数据,而dtype=’S‘是字符串。您必须使用适当的dtype (如int )导入数据。
您不需要导入csv,也不需要使用np.asarray。只需使用np.genfromtxt打开delimiter=' '和dtype=int的文件即可。
尝试:
import numpy as np
my_data = np.genfromtxt('test1.txt', dtype=int, delimiter=' ')
b = my_data.sum(axis=0)https://stackoverflow.com/questions/37280634
复制相似问题