前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >openGauss向量化Merge Join--inner join

openGauss向量化Merge Join--inner join

作者头像
yzsDBA
发布2022-12-27 13:52:58
3620
发布2022-12-27 13:52:58
举报

openGauss VecMergeJoin状态机

VecMergeJoin状态机如下图所示:

下面我们以一个例子为例,解释各个join的执行情况。

表t30和t31的结构及数据如下:

代码语言:javascript
复制
postgres=# select * from t30
id1 | id2
----|----
1  | 1
2  | 3
2  | 3
(3 rows)
代码语言:javascript
复制
postgres=# select * from t31
id1 | id2
----|----
1  | 1
5  | 5
2  | 3
(3 rows)

t30作为外表,t31作为内表,join条件为t30.id1=t31.id1。

inner join

1)EXEC_MJ_INITIALIZE_OUTER

取外表值1。进入EXEC_MJ_INITIALIZE_INNER状态

2)EXEC_MJ_INITIALIZE_INNER

取内表值1。进入EXEC_MJ_SKIP_TEST状态

3)EXEC_MJ_SKIP_TEST

1 = 1,进入EXEC_MJ_JOINTUPLES状态,并标记内表值1

4)EXEC_MJ_JOINTUPLES

BatchFillInnerAndOuter将内外表值分别放到m_pInnerMatch和m_pOuterMatch中,进入EXEC_MJ_NEXTINNER状态

5)EXEC_MJ_NEXTINNER

取内表的下一个值2,和外表值1比较。1 < 2,进入EXEC_MJ_NEXTOUTER状态

6)EXEC_MJ_NEXTOUTER

外表值取下一个值2,进入EXEC_MJ_TESTOUTER状态

7)EXEC_MJ_TESTOUTER

外表值2,和标记的内表值1比较。2 > 1,接着取内表当前值2,进入EXEC_MJ_SKIP_TEST状态。

8)EXEC_MJ_SKIP_TEST

2 = 2,进入EXEC_MJ_JOINTUPLES状态,标记内表位置为2

9)EXEC_MJ_JOINTUPLES

BatchFillInnerAndOuter将内外表值分别放到m_pInnerMatch和m_pOuterMatch中,进入EXEC_MJ_NEXTINNER状态。

10)EXEC_MJ_NEXTINNER

取内表的下一个值5,和外表值2比较。2 < 5,进入EXEC_MJ_NEXTOUTER状态

11)EXEC_MJ_NEXTOUTER

取外表的下一个值2,进入EXEC_MJ_TESTOUTER状态

12)EXEC_MJ_TESTOUTER

外表值2,和标记的内表值2比较。2 = 2,进入EXEC_MJ_JOINTUPLES状态,调整内表当前扫描位置为标记位置,即2。

13)EXEC_MJ_JOINTUPLES

BatchFillInnerAndOuter将内外表值分别放到m_pInnerMatch和m_pOuterMatch中,进入EXEC_MJ_NEXTINNER状态。

14)EXEC_MJ_NEXTINNER

取内表的下一个值5,和外表值2比较。2 < 5,进入EXEC_MJ_NEXTOUTER状态

15)EXEC_MJ_NEXTOUTER

外表值已取完,结束。

此时,m_pInnerMatch和m_pOuterMatch的值分别为:

代码语言:javascript
复制
m_pInnerMatch m_pOuterMatch
    1             1
    2             2
    2             2

最终调用函数ProduceResultBatchT,将两个batch投影到一个batch中,输出最终join结果。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-10-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 yanzongshuaiDBA 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • openGauss VecMergeJoin状态机
  • inner join
相关产品与服务
批量计算
批量计算(BatchCompute,Batch)是为有大数据计算业务的企业、科研单位等提供高性价比且易用的计算服务。批量计算 Batch 可以根据用户提供的批处理规模,智能地管理作业和调动其所需的最佳资源。有了 Batch 的帮助,您可以将精力集中在如何分析和处理数据结果上。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档