前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >从2023数据技术嘉年看行业数据库的执行引擎

从2023数据技术嘉年看行业数据库的执行引擎

作者头像
yzsDBA
发布2023-05-25 09:49:24
2720
发布2023-05-25 09:49:24
举报

2023年4月7-8日,数据技术嘉年华给我们带了一场数据库行业盛宴。重点关注下向量化引擎的技术实现原理和创新应用点。

1、MogDB基于openGauss内核在Copy导入优化方面使用了SIMD指令并行解析,能够提高导入性能10%-20%。SIMD指令优化方面同样可以用到分析型数据库中,比如向量化执行引擎。openGauss本身已实现向量化执行引擎,将执行器以行执行的模式改造成了以batch执行的批量模式。但本身并没有利用SIMD指令进行深度优化。

2、GoldenDB由金融TP型数据库发展到了HTAP数据库,增加了行列混合存储特性,以及向量计算,利用CPU指令集进行优化。可惜没有开源,不知道具体如何实现的列存及如何向量计算并利用CPU指令进行的优化。

3、oceanbase增加了行列混合存储,表格分成多个Row Group,行组内按列存储,在这个基础上增加了向量化执行引擎。利用SIMD指令进行了深度优化。Oceanbase代码已开源,可以从GitHub上下载学习如何利用SIMD指令深度优化:github.com/oceanbase/oceanbase

4、TDSQL同样设计了向量化执行引擎。应该没有实现深度SIMD优化。

5、基于GreenPlum而来的YMatrix,自研开发了mars2存储引擎,增加了min、max等统计信息。可以通过min、max来过滤数据块,仅加载满足条件的值所在的块,大大减少了顺序扫描行数及IO。同时支持全面向量化,充分利用SIMD指令进行优化,据说基本支持了全部的算子。向量化加速100倍以上,这个就很强大了。可惜,Ymatrix不开源。

从大会上看,基本上向量化执行引擎成为了分析型数据库的标配,并且在SIMD指令层进行并行执行。有开源也有商业版的。另外在这方面做的比较牛的还有ClickHouse、StarRocks、DorisDB等。惊喜的是,这些数据库都是开源的,可以从代码中了解向量化执行引擎以及SIMD优化的机制原理。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2023-04-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 yanzongshuaiDBA 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档