首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >使用scipy.io.savemat将等大小ndarray的numpy对象数组存储到.mat文件中

使用scipy.io.savemat将等大小ndarray的numpy对象数组存储到.mat文件中
EN

Stack Overflow用户
提问于 2019-05-21 22:28:13
回答 1查看 311关注 0票数 0

我正在尝试使用python创建.mat数据文件。matlab代码期望数据具有一定的格式,其中非均匀大小的二维ndarray作为对象存储在列向量中。因此,在我的例子中,将有k个形状为( m_i,n)的numpy数组-每个数组具有不同的m_i-存储在形状为(k,1)的numpy数组中。然后,我将这个对象数组添加到一个字典中,并将其传递给scipy.io.savemat()

只要m_i确实不同,这种方法就可以很好地工作。如果所有k个数组恰好都有相同的行数m_i,这种行为就会变得很奇怪。首先,它需要非常显式地赋值给dtype=object的numpy数组,该数组已初始化为最终大小k,否则numpy只是创建一个三维数组。但是,即使我有正确的python格式,并使用savemat将其存储到.mat文件中,在将其转换为matlab格式时仍存在某种问题。

当我使用scipy.io.loadmat从.mat文件重新加载数据时,我发现我仍然有一个形状为(k,1)的对象数组,它仍然具有形状为(m,n)的元素。但是,每个元素不再是int或float,而是形状(1,1)的数值数组,必须对其进行进一步的索引才能访问包含的int或float。因此,对象向量的单个元素应该是形状(2,4)的数值数组,如下所示:

[array([[array([[0.82374894]]), array([[0.50730055]]),
        array([[0.36721625]]), array([[0.45036349]])],
       [array([[0.26119276]]), array([[0.16843872]]),
        array([[0.28649524]]), array([[0.64239569]])]], dtype=object)]

这也给我试图为其构建数据文件的matlab代码带来了一个问题。对于形状不同的对象数组,它运行得很好,但当存在包含相同形状数组的数组时,它将中断。

我知道这是一个相当模糊而且可能不可避免的问题,但我想我会看看是否有人遇到过它并找到了解决方法。谢谢。

EN

回答 1

Stack Overflow用户

发布于 2019-05-22 02:29:20

我对这个问题不太清楚。让我试着重现你的案例:

In [58]: from scipy.io import loadmat, savemat                               
In [59]: A = np.empty((2,1), object)     
In [61]: A[0,0]=np.arange(4).reshape(2,2)                                    
In [62]: A[1,0]=np.arange(6).reshape(3,2)                                    
In [63]: A                                                                   
Out[63]: 
array([[array([[0, 1],
       [2, 3]])],
       [array([[0, 1],
       [2, 3],
       [4, 5]])]], dtype=object)
In [64]: B=A[[0,0],:]                                                        
In [65]: B                                                                   
Out[65]: 
array([[array([[0, 1],
       [2, 3]])],
       [array([[0, 1],
       [2, 3]])]], dtype=object)

正如我今天早些时候解释的那样,从匹配大小的数组创建对象数据类型数组需要特殊处理。np.array(...)尝试创建一个更高维数组。https://stackoverflow.com/a/56243305/901925

保存:

In [66]: savemat('foo.mat', {'A':A, 'B':B})                                  

正在加载:

In [74]: loadmat('foo.mat')                                                  
Out[74]: 
{'__header__': b'MATLAB 5.0 MAT-file Platform: posix, Created on: Tue May 21 11:20:42 2019',
 '__version__': '1.0',
 '__globals__': [],
 'A': array([[array([[0, 1],
        [2, 3]])],
        [array([[0, 1],
        [2, 3],
        [4, 5]])]], dtype=object),
 'B': array([[array([[0, 1],
        [2, 3]])],
        [array([[0, 1],
        [2, 3]])]], dtype=object)}
In [75]: _74['A'][1,0]                                                       
Out[75]: 
array([[0, 1],
       [2, 3],
       [4, 5]])

您的问题案例看起来像是一个包含数字的对象dtype数组:

In [89]: C = np.arange(4).reshape(2,2).astype(object)                        
In [90]: C                                                                   
Out[90]: 
array([[0, 1],
       [2, 3]], dtype=object)
In [91]: savemat('foo1.mat', {'C': C})                                       
In [92]: loadmat('foo1.mat')                                                 
Out[92]: 
{'__header__': b'MATLAB 5.0 MAT-file Platform: posix, Created on: Tue May 21 11:39:31 2019',
 '__version__': '1.0',
 '__globals__': [],
 'C': array([[array([[0]]), array([[1]])],
        [array([[2]]), array([[3]])]], dtype=object)}

显然,savemat已经将整数对象转换成与2dmatlab兼容的数组。在MATLAB中,任何东西,即使是标量,都至少是2d的。

===

在Octave中,对象dtype数组都会生成单元格,而2d数值数组会生成矩阵:

>> load foo.mat
>> A
A =
{
  [1,1] =

    0  1
    2  3

  [2,1] =

    0  1
    2  3
    4  5

}
>> B
B =
{
  [1,1] =

    0  1
    2  3

  [2,1] =

    0  1
    2  3

}
>> load foo1.mat
>> C
C =
{
  [1,1] = 0
  [2,1] = 2
  [1,2] = 1
  [2,2] = 3
}

Python: Issue reading in str from MATLAB .mat file using h5py and NumPy

是相对较新的,这表明了倍频程HDF5和MATLAB之间的区别。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56240508

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档