我正在尝试将一个4D数组转换为2D数组,以便使用sklearn SVM模型,但当我尝试使用模型中的数据时,它给我带来了问题。因此,我将数据拆分为训练数据和测试数据,然后将其转换为np数组,如下所示。
#Train data
npXt = np.array(x_train)
npYt = np.array(y_train)
#Eval test data
npXT = np.array(x_test)
npYT = np.array(y_test)
然后我这样看它的形状
npXt.shape
这就给了我这个
(28709, 48, 48, 1)
我试着通过这样做来改变它;
npXt.transpose((28709, 48, 48, 1)).reshape(np.prod(npXt.shape[:2]),-1)
但是给出了这个错误。
AxisError Traceback (most recent call last)
<ipython-input-8-2682876229f4> in <module>()
----> 1 npXt.transpose((28709, 48, 48, 1)).reshape(np.prod(npXt.shape[:2]),-1)
AxisError: axis 28709 is out of bounds for array of dimension 4
我在这里做错了什么?
感谢你在这方面的帮助
更新:谢谢你的所有建议:我试过了,出现了如下错误:
ValueError: bad input shape (28709, 7)
下面是我为达到这个目的所做的修复。我认为的问题是,我目前没有对数组进行重塑。所以我像这样下载数据,这样就可以很好地工作:
x_train, y_train, x_test, y_test = aiu.getKaggleData(file,numClass)
结果如下所示:
Creating Testing and Training datasets
Filling datasets
Transforming data to fit model's needs
Normalizing traing/testing datasets
Reshaping data
28709 train samples
3589 test samples
我希望这个和这个在我构建的另一个模型中工作。接下来,我像这样构建SVM模型:
clf = SVC(C=0.01, kernel='linear', decision_function_shape='ovo', probability=True)
然后将训练和测试数据转换为np数组,如下所示
#Train data
npXt = np.array(x_train)
npYt = np.array(y_train)
#Eval test data
npXT = np.array(x_test)
npYT = np.array(y_test)
然后使用所建议的内容
my_array = np.ones((28709, 48, 48, 1))
newXTrain = np.transpose( my_array ).reshape(np.prod(npXt.shape[:2]),-1)
print(newXTrain.shape)
print(npYt.shape)
这给了我这样的结论:
(1378032, 48) #for data
(28709, 7) #for lables
然后我试着像这样训练模型
clf.fit(newXTrain,npYt)
这就给了我这个
raise ValueError("bad input shape {0}".format(shape))
ValueError: bad input shape (28709, 7)
感谢你到目前为止的所有帮助
我甚至尝试过这样做,但仍然给出一个错误:
newXTrain = np.transpose( my_array ).reshape(np.prod(npXt.shape[:1]),-1)
这给了我一个看起来很有希望的东西。
(28709, 2304)
(28709, 7)
但给出了与ValueError: bad input shape (28709, 7)
相同的错误
发布于 2018-08-02 16:03:09
我不明白你为什么在重塑之前转置数组,但是你使用转置的方式是错误的。
它应该是:
my_array = np.ones((28709, 48, 48, 1))
np.transpose( my_array ).reshape(np.prod(npXt.shape[:2]),-1)
如果您将一个元组传递给transpose函数,它会将其解释为矩阵轴的索引的新顺序。因此,转置轴号28709在这里没有意义。
如果你想重塑你可能根本不需要转置
发布于 2018-08-02 15:55:37
我认为这是你使用转置的方式。应该作为参数传递的应该是位置列表,在本例中是介于0和3之间的整数。
我猜您正在尝试反转npXt的索引,因此可能应该将(3,2,1,0)而不是(28709,48,48,1,1)作为转置函数的参数。
https://stackoverflow.com/questions/51648253
复制相似问题