我有三个数据帧:字典、SourceDictionary和MappedDictionary。字典andSourceDictionary只有一列,即单词作为字符串。拥有百万条记录的字典是MappedDictionary (大约10M条记录)的子集,MappedDictionary中的每条记录都是字典的子串。要在MappedDictionary中映射的记录(包含两列):AppleGreen Apple
我计划在java中做两个for循环和make子串操作,但问题是1百万*
我在一个巨大的搁置字典上循环使用每个键:值对(不改变它)来做一些事情。虽然字典比记忆大,但我关心的是这是否会耗尽内存。dictFileName) # doing something using key and value 在循环的迭代中读取的键:值对会在下一次迭代时从内存中丢弃吗?我认为必须这样做,否则内存就会用完,因为循环本质上是
我正在循环中处理数据帧。在每次迭代中,都有对dataframe变量执行的操作。在每次迭代结束时,我需要将此数据存储到字典中,其中包含与迭代索引相关的索引。range(20))for k in range(5): dict[k] = df
我所期望的'dict‘的结果将是一本包含5个数据的字典我试着一步一步地运行操作,而不是循环。我发现,最初正确</