腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
shuffle
散
列
连接
和
排序
合并
连接
到底是
如何
工作
的
?
apache-spark
我可以解释广播
连接
是
如何
工作
的
,本文很好地解释了这一点:https://jaceklaskowski.gitbooks.io/mastering-spark-sql/spark-sql-joins-broadcast.html但是我找不到一篇文章来解释
shuffle
、hash、join
和
sort merge join
的
内部原理。有没有人能给出这两个
的
逐步算法?
浏览 26
提问于2019-02-21
得票数 3
1
回答
如何
在星火中强制启用广播
连接
apache-spark
、
apache-spark-sql
、
mapjoin
sbg_published.web_funnel_detail_v4 b我使用spark.sql()运行这个查询,第一个表有1 million记录,第二个表有1.5 billion records"spark.dynamicAllocation.enabled"="true" "spark.
sh
浏览 11
提问于2022-05-23
得票数 0
1
回答
为什么星火规划师更喜欢
排序
合并
连接
而不是杂乱
散
列
连接
?
apache-spark
、
join
、
apache-spark-sql
为什么Spark2.3中
的
星火规划师更喜欢一种类型
的
合并
连接
而不是混搭
的
散
列
连接
?换句话说,为什么spark.sql.join.preferSortMergeJoin配置属性是?杂乱
的
散
列
连接
有什么问题?这是特定于星火,它是以分布式
的
方式进行计算,还是其他一些在联接算法中固有的东西?您可以找到JoinSelection执行规划策略
和
中使用
浏览 0
提问于2018-04-25
得票数 18
回答已采纳
3
回答
在Oracle中,
散
列
连接
和
排序
合并
连接
有什么不同?
oracle
、
join
在Oracle中,我可以使用提示USE_HASH或USE_MERGE来指示优化器执行
散
列
联接或
排序
合并
联接。这些类型
的
连接
有什么不同,什么时候/为什么我应该使用其中之一?
浏览 2
提问于2010-11-10
得票数 4
1
回答
阿帕奇菲尼克斯+五旬节蒙德里安错误
的
加入顺序
mondrian
、
apache-phoenix
我使用
的
是中
的
Apache凤凰4.5.2,它安装在CDH5.4集群上。现在,我正在尝试使用它
的
宾得BA5.4服务器与嵌入式Mondrian
和
SAIKU插件安装。我计划使用is作为五旬节Mondrian引擎
的
聚合器。url指向,并通过phoenix.connection.autoCommit在hbase-site.xml中启用它
的
自动提交),将大约6千5百万事实导入事实表,现在我有大约400行时间维度表。问题是,Mondrian生成查询时,假设表
的
顺序无关紧要。它使用FR
浏览 0
提问于2016-02-17
得票数 0
2
回答
为什么访问谓词
和
过滤谓词在这里是相同
的
?
oracle
、
oracle-sqldeveloper
、
sql-execution-plan
、
sqlperformance
、
sql-tuning
当我使用Oracle SQL Developer获得上述查询
的
自动跟踪输出时,我看到
连接
条件用于访问
和
过滤谓词。我
的
问题是,它是否从DEPT_ID_PK读取所有department_ids,然后使用这些ID访问
和
过滤employees表?如果是这样,为什么employees表有全表扫描?为什么它使用departments表
的
department_ids再次读取employees表?有没有人可以简单地一步一步地阅读这份执行计划,并解释为什么这里使用访问
和
过滤谓词? 诚挚<
浏览 50
提问于2021-01-14
得票数 1
1
回答
PostgreSQL中
的
合并
联接对索引
列
执行
排序
postgresql
、
query-optimization
c INNER JOIN city ci ON ci.ci_id = a.ci_id
列
customer.a_id、address.a_id、city.ci_id
和
adress.ci_id都有一个btree索引。我想使用
合并
连接
,而不是哈希
连接
,因为我看到哈希
连接
并不真正使用索引,所以我使用Set enable_hashjoin=off来转换
散
列</e
浏览 1
提问于2022-11-01
得票数 0
2
回答
散
列
联接和
合并
联接(Oracle RDBMS )之间
的
区别是什么?
sql
、
performance
、
oracle
、
join
散
列
联接和
合并
联接(特别是在Oracle RDBMS中)之间
的
性能增益/损失是什么?
浏览 3
提问于2009-07-10
得票数 62
回答已采纳
1
回答
当所有的选择条件都不符合时,星火会选择哪一个加入?
apache-spark
、
join
、
apache-spark-sql
我们知道在星火中有三种类型
的
连接
--广播
连接
、洗牌
连接
和
排序
合并
连接
:如果有两个大表
的
联接而
连接
键不能
排
浏览 8
提问于2020-12-18
得票数 1
回答已采纳
1
回答
为什么postresql
排序
没有order by?
postgresql
、
sorting
请看下面的超级简单
的
sql。Time": 0.114, "Execution Time": 0.033]1,"man“就像拥有1,"man“ 在这个超级简单<e
浏览 20
提问于2021-06-08
得票数 0
2
回答
哈希,
合并
和循环
连接
的
区别?
sql-server
在Server中,可以指定联接提示:
合并
连接
这三个
连接
提示
的
定义是什么,应该在什么时候使用?
浏览 0
提问于2011-01-27
得票数 46
回答已采纳
3
回答
即使两个表都很大,Oracle也总是使用
散
列
连接
吗?
oracle
、
join
我
的
理解是,只有当两个表中
的
一个足够小,可以作为哈希表放入内存中时,哈希
连接
才有意义。所以我想知道在两个表都非常大
的
情况下哈希
连接
是
如何
可能
的
? 谢谢杨
浏览 3
提问于2011-11-19
得票数 11
回答已采纳
1
回答
SSIS数据流中
的
“不存在”
sql-server
、
ssis
我有一个数据流,其中我需要将来自两个不同源
的
数据
合并
到一个目标表中,但也希望只插入唯一值并忽略现有值。每个源都按
散
列
进行
排序
。现有的数据源被多播到两个
连接
以检
浏览 1
提问于2015-07-07
得票数 1
1
回答
连接
表
的
大内存授权
sql-server
、
t-sql
、
memory-grant
当我从两个
连接
的
表中选择
列
时,将获得一个巨大
的
内存授权(529808)。如果我分别查询每个表列,则其
合并
内存授权仅为8008。📷📷📷
浏览 0
提问于2021-11-17
得票数 5
回答已采纳
1
回答
Postgres 9.4:
如何
在运行速度慢10倍
的
任何数组查找中修复Query Planner
的
哈希
连接
选择
postgresql
、
postgresql-9.4
、
database-tuning
、
query-tuning
当然,我意识到弄清楚这些问题可能很复杂,需要大量信息,但我希望有一个已知
的
问题或解决方法来解决这个特定
的
问题。我已经缩小了导致次优查询计划
的
查询更改
的
范围(这是运行Postgres 9.4)。tag_device表是一个有大约200万个条目的
连接
表,devices表有大约150万个条目,tags表有大约500,000个条目(注意:实际
的
IP值只是虚构
的
)。因此,在快速版本
的
查询中,数组中有30个项目。如果我将它增加到阵列中
的
80个条目
浏览 1
提问于2015-09-23
得票数 0
1
回答
在潘达斯,
合并
怎么这么快?即使我还没有按索引
排序
呢?
performance
、
pandas
、
merge
我正在
合并
熊猫中
的
两个数据集,并希望加快这个过程,所以我在用于
合并
的
列
中对这两个数据集进行了
排序
。(以前,这些
列
根本没有
排序
。)
排序
没有造成明显
的
速度差异,两者都花了大约8秒。如果我手动
合并
两堆纸,比如说,它们
的
页码,我会首先按页码对它们进行
排序
。否则,我将不得不做很多来回翻转之间
的
堆栈。 我写了一个测试来比较这两个过程。它按随机顺序生成两个帧,
浏览 0
提问于2018-03-20
得票数 6
2
回答
具有不等式条件
的
合并
连接
算法
database
、
algorithm
、
oracle
我读到Oracle支持
合并
连接
和
不等
连接
谓词。在实现这种
连接
时有没有关于算法
的
在线参考?如果有人知道
如何
做到这一点,你能回答吗?
浏览 0
提问于2012-02-24
得票数 6
1
回答
是什么使优化器在计划中插入
排序
操作符?
sql-server
、
execution-plan
、
sort-operator
优化器选择在计划中插入
排序
操作符(以满足流聚合或
合并
连接
等)
的
原因是什么。而不是进行
散
列
匹配或
散
列
连接
? 我现在已经看到了几个例子,在这些例子中,它显然犯了一个错误,并且暗示查询会使它变得更快。我看到
的
例子来自Server 2016。
浏览 0
提问于2023-02-02
得票数 0
回答已采纳
1
回答
在
排序
列上
合并
联接,而不是哈希
连接
sql-server
varchar(39), ...表B id int, ...两个表都在
列
ID上
排序
。ID只是身份,由自动递增
的
整数1到n填充。SELECT * WHERE A.id = B.id; 我得到一个
散
列
连接
,而不是高效
的
合并
连接
。
如何<
浏览 4
提问于2020-09-14
得票数 0
2
回答
如何
识别执行计划会考虑嵌套循环
连接
还是
散
列
连接
算法?
sql-server
、
join
我想知道有什么特定
的
数据模式/算法可以用来决定是使用嵌套循环
连接
还是使用
散
列
匹配
连接
。如果两个输入都在具有相同数量
的
记录
的
连接
列上进行
排序
,则可能选择
合并
连接
,但是谁能解释一下其他两个?
浏览 0
提问于2016-08-26
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
过去一年,Spotify最大一次数据流优化实践
为散点添加趋势线
每个开发人员都应该知道的 6 种算法
R语言必学包之dplyr
浅谈数据库Join的实现原理
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券