单独处理每个文件( 90ms )所需的时间大致相同,但当我使用批量导入给定目录的方法时,每个文件的时间会递增(从90MS增加到300个文件后的4000 to )。方法processTrainText是在目录中的每个文本文件中调用的。当在processTrainDirectory中使用时,此方法所需的时间会越来越长</em
我有一个程序,对于选择的迭代数,它随机地从LETTERS中选择N个元素(没有替换),并将所有迭代合并到一个主df中。我在程序中添加了一个“唯一性”算法,与以前的所有迭代相比,该算法检查当前迭代中存在多少不同的LETTERS元素。基本上,我希望每个跑步都是“不同的”与其他。例如,如果当前运行选择了c(A, J, C, Y, W),而上一次运行为c(