{origin:
2018-06-01T09:30:00.000+00:00 BID 30415.000 4
2018-06-01T09:30:00.000+00:00 BID 30415.000 3
2018-06-01T09:30:01.000+00:00 BID 30415.000 2
2018-06-01T09:30:01.000+00:00 BID 30414.000 4
2018-06-01T09:30:01.000+00:00 ASK 30416.000 1
2018-06-01T09:30:01.000+00:00 ASK 30416.000 2
2018-06-01T09:30:01.000+00:00 TRADE 30415.000 1
}
我想重新格式化数据,如下所示:
timestamp bid bid_size ask ask_size交易trade_size
{2018-06-01T09:30:00.000+00:00 30415 4 nan nan nan nan
2018-06-01T09:30:00.000+00:00 30415 3 nan nan nan nan
2018-06-01T09:30:01.000+00:00 30415 2 30416 1 nan nan
2018-06-01T09:30:01.000+00:00 30415 4 30416 2 30415 1
}
你能帮助我使用Python吗?我也遇到了一个问题,重复的时间戳问题,我认为这是因为它的节拍数据导致相同的时间戳与不同的出价大小/出价大小,我也不知道如何正确地使他们在同一行。
发布于 2018-06-20 22:51:48
从你的例子中并不完全清楚,但首先要做的是将数据加载到一个叫做df
的pandas DataFrame中,而不是现在的字典中。确保此DataFrame具有清晰的标头名称。
如果你有熊猫DataFrame中的数据,你可以使用DataFrame.pivot()
,更多的解释请参见this link。
在你的例子中,你可能会得到类似这样的结果:
df.pivot(index=<Column1>, columns=<Column2>, values=<Column3>)
其中您需要使用您提供的适当标头替换<ColumnX>
。
希望这能有所帮助!
https://stackoverflow.com/questions/50950746
复制相似问题