问构造由不同块组成的pandas.DataFrame的最佳方法
EN

Stack Overflow用户

提问于 2012-03-20 20:49:24

回答 1查看 1.5K关注 0票数 1

我每天都在批量进行模拟:我做了365次模拟来获得全年的结果。每次运行之后，我希望从结果中提取一些数组，并将它们添加到pandas.DataFrame中，以便稍后进行分析。

我有一个粗略的模型(进行优化)和一个更精确的后仿真模型，所以我可以从两个来源得到相同的变量。如果进行了后仿真，结果可能会覆盖优化结果。

更复杂的是，优化模型的输出间隔较小，取决于离散化设置，但最终的分析将发生在后仿真的较大间隔上)。

构建这个DataFrame的最佳方法是什么？

这是我第一次

我应该在步骤4和6中使用哪些方法)？还是从一开始就有更好的方法？谢谢你，咆哮

回答已采纳

发布于 2012-03-23 21:45:21

我认为使用DataFrame.combine_first是可行的方法，但根据数据的规模，使用"update“这样的方法只修改现有DataFrame中的特定行可能更有用。combine_first更通用，并且可能导致结果与任何输入的大小不同(因为索引将被合并在一起)。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/9794697

复制

相似问题

问构造由不同块组成的pandas.DataFrame的最佳方法EN