首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >从oracle中随机选择样本时两个查询之间的差异

从oracle中随机选择样本时两个查询之间的差异
EN

Stack Overflow用户
提问于 2009-07-21 14:46:51
回答 4查看 1.9K关注 0票数 2

This question回答了如何从oracle中随机选择样本的问题,这正是我所需要的。然而,我不明白这种解决方案之间的区别

代码语言:javascript
复制
SELECT  *
FROM    (
        SELECT  *
        FROM    mytable
        ORDER BY
                dbms_random.value
        )
WHERE rownum <= 1000

像这样的东西

代码语言:javascript
复制
select * from mytable where rownum<=1000 order by dbms_random.value

当我使用第一种方法查询时,它需要很长时间(仍然没有完成),但当我使用第二种方法查询时,它非常快,但结果似乎不是随机的。

感谢你们能提供的建议和方向。

谢谢!

JC

EN

回答 4

Stack Overflow用户

回答已采纳

发布于 2009-07-21 14:52:24

在任何排序发生之前,Oracle根据条件选择行。因此,您的第二个查询可以理解为:

  1. 按随机值

从这1000行中选择前1000行

因此,您将始终以随机顺序获得相同的1000行。第一个查询强制Oracle首先对所有行进行随机排序:

  1. 按随机值对所有行进行排序
  2. 选择这些随机排序的前1000行
票数 7
EN

Stack Overflow用户

发布于 2009-07-21 14:51:23

Oracle中,ORDER BYROWNUM之后求值。

此查询:

代码语言:javascript
复制
SELECT  id, ROWNUM
FROM    (
        SELECT  NULL AS id
        FROM    dual
        UNION ALL
        SELECT  1 AS id
        FROM    dual
        )
ORDER BY
        id

将检索以下内容:

代码语言:javascript
复制
  id    rownum
----    ------
   1         2
NULL         1

您的第一个查询首先对值进行随机排序,然后选择前1000条记录,这需要很长时间。

第二个查询首先选择1000记录,然后按随机顺序对它们进行排序,这当然更快,但结果不是随机的。

票数 1
EN

Stack Overflow用户

发布于 2009-07-21 14:59:01

一种更快的替代方案:

从emp样本中选择*(10);

从emp SAMPLE(5)块中选择*;

点击此处阅读:http://oracleact.com/papers/sampleclause.html

EDIT1:重读之后,这一点已经被提到(或多或少)。但是,我不能删除此答案。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/1159661

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档