我已经将Retrosheet (可追溯到1952年的逐场棒球数据库)数据导入到MySQL数据库中。有一个标识棒球比赛的GAME_ID字段。field: game sequence for double-headers, triple-headers.因为我的大多数查询都需要日期,所以我创建了一个GAME_DATE列,并解析了GAME_ID字段以更新它。假设我想在我的
Pandas的记忆问题,for i in range(5): print(df)
df是从数据库中读取的熊猫数据,每次迭代都增加了1GB的弹性内存,所有的迭代都从数据库中检索相同的数据。根据我的观点,对于每个迭代,弹性内存不应该增加,因为变量df超出了范围(在新的迭代中)。结果是,经过一些迭代之后,弹性内存最多增加了12 Gb,我得到了错误的OutOfMemory。db