如果不通过pandas操作将2个或更多查询链接在一起,我似乎无法找到这个问题的解决方案。(我之前曾尝试在PostgreSQL中以cur.execute("select distinct group from data where random() < {0}".format(rand_coef))的方式进行随机采样,但我无法将结果数组组合到一个查询中,也无法指定确切的n值。)假设的数据集和查询如下: 假设我想从下面的数据中随机选择n</
查询,可以用来为这个表中的每个记录选择n(或更少)随机实体组的所有行?假设n是2,所以查询应该为记录3选择所有行,为记录1和记录2的任意两个随机实体组选择所有行。最后的结果应该由accession、entity、docid、sentenceid排序。下面是n=2的一个示例结果:1 A 100 1001
1 A 123
我有以下SQL代码来执行清理任务:
SELECT表中满足条件的第一个n行,并将它们放入一个新表中。注意,对于不同的表,[source].var='1'是不同的。TOP 3=‘1’;选择TOP n* INTO table4,其中source.var5 e.var4=‘1’;选择TOP n* INTO table5,从哪里的源