我有文本文件中的数据,我已经成功地将其解析成MultiIndex pandas结构,但是我不知道我所拥有的数据是否能完成我想要它做的事情。
我所拥有的是具有许多标识符(索引)的大量时间序列数据。我最终需要计算每个时间序列的自相关时间和其他时间序列统计数据。
#!/usr/bin/python
from pandas import Series, DataFrame, MultiIndex
...
data = Series(value, index=[smear, block, obser])
print data
print data.ix[('0.07','1','0')]这将为数据结构生成如下所示的输出:
0.07 0 0 1.5802561
1 0.82228274
2 0.70917131
3 0.90707599
4 0.8517223
5 0.26346815
1 0 1.8163109
1 0.9972372
2 1.0872181
3 1.2459765
4 1.1500478
5 0.35668446
2 0 2.0734421
1 1.2863641
2 1.4033583
...
0.34 2 3 1.9047537
4 1.8193612
5 0.77739654
3 0 2.2757423
1 1.5499509
2 1.6623247
3 1.8330889
4 1.7484187
5 0.72914635
4 0 2.3269071
1 1.7137621
2 1.7359068
3 1.9162268
4 1.9714984
5 1.2095218
Length: 32100并且我感兴趣的时间序列信息存在于特定的值smear,block,obser。这里给出了一个smear = 0.07,block = 1,obser =0的例子。最右边的一列是我的时间序列数据。
0.07 1 0 1.8163109
0 1.8191682
0 1.816836
0 1.8172168
0 1.8169705
...
0 1.8184542
0 1.8170772
0 1.8159326
0 1.8161826
Length: 107我如何重塑数据,以便我可以编写计算自相关时间的函数?
发布于 2013-05-11 06:02:42
首先,使用data.ix(whatever)对象的"values“组件获取时间序列的原始数组。然后使用this问题解答中描述的方法,使用numpy.correlate计算自相关。
https://stackoverflow.com/questions/16490005
复制相似问题