我正在尝试从CSV文件中选择要读取的行,选择基于:s = n//10
# skip value will be used with skip_row in pd.read_csv文件大小接近5 GB,这就是为什么需要随机读取10%的文件。我们的期望是random.select不会占用太多内存,令人惊讶的是它会占用太多内存(如任务管理器所示,最高可达5 GB甚至
我知道fread是相对较新的,但它确实提供了很大的性能改进。我想知道的是,您能从正在读取的文件中选择行和列吗?有点像read.csv.sql所做的?我知道使用select选项的fread可以选择要读取的列,但是只读取满足特定条件的行如何?
例如,可以使用fread实现如下内容吗?V9, V10 from file where V