我有非常大的表(3000万行),我想在R中加载一个数据框。read.table()有很多方便的功能,但是似乎有很多逻辑在执行,会慢 事情倒了。 在我的情况下,我假设我知道列的类型提前,该表不包含任何列标题或行名称,并没有任何病态字符,我不必担心。
我知道用表格作为列表来阅读扫描()可能会很快,例如:
datalist < - scan('myfile',sep ='\ t',list(url ='',popular = 0,mintime = 0,maxtime = 0)))
但是,我的一些尝试将其转换为数据帧似乎将上述性能降低了6倍:
df < - as.data.frame(scan('myfile',sep ='\ t',list(url ='',popular = 0,mintime = 0,maxtime = 0))))
有没有更好的方法来做到这一点?或者可能完全不同的方法来解决这个问题?
相似问题