我正在尝试使用python创建.mat数据文件。matlab代码期望数据具有一定的格式,其中非均匀大小的二维ndarray作为对象存储在列向量中。因此,在我的例子中,将有k个形状为( m_i,n)的numpy数组-每个数组具有不同的m_i-存储在形状为(k,1)的numpy数组中。然后,我将这个对象数组添加到一个字典中,并将其传递给scipy.io.savemat()
。
只要m_i确实不同,这种方法就可以很好地工作。如果所有k个数组恰好都有相同的行数m_i,这种行为就会变得很奇怪。首先,它需要非常显式地赋值给dtype=object的numpy数组,该数组已初始化为最终大小k,否则numpy只是创建一个三维数组。但是,即使我有正确的python格式,并使用savemat
将其存储到.mat文件中,在将其转换为matlab格式时仍存在某种问题。
当我使用scipy.io.loadmat
从.mat文件重新加载数据时,我发现我仍然有一个形状为(k,1)的对象数组,它仍然具有形状为(m,n)的元素。但是,每个元素不再是int或float,而是形状(1,1)的数值数组,必须对其进行进一步的索引才能访问包含的int或float。因此,对象向量的单个元素应该是形状(2,4)的数值数组,如下所示:
[array([[array([[0.82374894]]), array([[0.50730055]]),
array([[0.36721625]]), array([[0.45036349]])],
[array([[0.26119276]]), array([[0.16843872]]),
array([[0.28649524]]), array([[0.64239569]])]], dtype=object)]
这也给我试图为其构建数据文件的matlab代码带来了一个问题。对于形状不同的对象数组,它运行得很好,但当存在包含相同形状数组的数组时,它将中断。
我知道这是一个相当模糊而且可能不可避免的问题,但我想我会看看是否有人遇到过它并找到了解决方法。谢谢。
发布于 2019-05-22 02:29:20
我对这个问题不太清楚。让我试着重现你的案例:
In [58]: from scipy.io import loadmat, savemat
In [59]: A = np.empty((2,1), object)
In [61]: A[0,0]=np.arange(4).reshape(2,2)
In [62]: A[1,0]=np.arange(6).reshape(3,2)
In [63]: A
Out[63]:
array([[array([[0, 1],
[2, 3]])],
[array([[0, 1],
[2, 3],
[4, 5]])]], dtype=object)
In [64]: B=A[[0,0],:]
In [65]: B
Out[65]:
array([[array([[0, 1],
[2, 3]])],
[array([[0, 1],
[2, 3]])]], dtype=object)
正如我今天早些时候解释的那样,从匹配大小的数组创建对象数据类型数组需要特殊处理。np.array(...)
尝试创建一个更高维数组。https://stackoverflow.com/a/56243305/901925
保存:
In [66]: savemat('foo.mat', {'A':A, 'B':B})
正在加载:
In [74]: loadmat('foo.mat')
Out[74]:
{'__header__': b'MATLAB 5.0 MAT-file Platform: posix, Created on: Tue May 21 11:20:42 2019',
'__version__': '1.0',
'__globals__': [],
'A': array([[array([[0, 1],
[2, 3]])],
[array([[0, 1],
[2, 3],
[4, 5]])]], dtype=object),
'B': array([[array([[0, 1],
[2, 3]])],
[array([[0, 1],
[2, 3]])]], dtype=object)}
In [75]: _74['A'][1,0]
Out[75]:
array([[0, 1],
[2, 3],
[4, 5]])
您的问题案例看起来像是一个包含数字的对象dtype数组:
In [89]: C = np.arange(4).reshape(2,2).astype(object)
In [90]: C
Out[90]:
array([[0, 1],
[2, 3]], dtype=object)
In [91]: savemat('foo1.mat', {'C': C})
In [92]: loadmat('foo1.mat')
Out[92]:
{'__header__': b'MATLAB 5.0 MAT-file Platform: posix, Created on: Tue May 21 11:39:31 2019',
'__version__': '1.0',
'__globals__': [],
'C': array([[array([[0]]), array([[1]])],
[array([[2]]), array([[3]])]], dtype=object)}
显然,savemat
已经将整数对象转换成与2dmatlab兼容的数组。在MATLAB中,任何东西,即使是标量,都至少是2d的。
===
在Octave中,对象dtype数组都会生成单元格,而2d数值数组会生成矩阵:
>> load foo.mat
>> A
A =
{
[1,1] =
0 1
2 3
[2,1] =
0 1
2 3
4 5
}
>> B
B =
{
[1,1] =
0 1
2 3
[2,1] =
0 1
2 3
}
>> load foo1.mat
>> C
C =
{
[1,1] = 0
[2,1] = 2
[1,2] = 1
[2,2] = 3
}
Python: Issue reading in str from MATLAB .mat file using h5py and NumPy
是相对较新的,这表明了倍频程HDF5和MATLAB之间的区别。
https://stackoverflow.com/questions/56240508
复制相似问题