我在R中有一个dataframe,它包含前面查询的输出。不幸的是,我不能直接用SQL做这件事,因为它太慢了,所以我使用data.table包。data.table包的输出是一个包含50,000个ids的数据帧。我需要从数据库中提取每个id的所有记录。
# x is a dataframe containing 50,000 ids.
通常,我会这样做,
dbGetQuery(con, "Select * from data where id in x")
但那是行不通的。另一种方法是在for循环中执行50,000个查询,但我认为必须有更有效的方法来做到这一点。
执行此操作的最有效方法是什么?
发布于 2015-10-29 05:57:11
例如,
x <- 0:3
> q <- "select * from table where id in (%s)"
> sprintf(q,paste(x,collapse = ","))
[1] "select * from table where id in (0,1,2,3)"
正如我在评论中提到的,有些数据库对可以放在IN
子句中的项数有限制。我对MySQL还不够熟悉,不知道它是什么,但我敢打赌,它足够大了,你只需要几个查询就能做到这一点。
在许多情况下,这比将in放在数据库中的表中并执行连接效率要低(慢),但有时人们无法访问完成此操作所需的数据库。
https://stackoverflow.com/questions/33401987
复制相似问题