前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >GPDB中AOCO列存页的checksum

GPDB中AOCO列存页的checksum

作者头像
yzsDBA
发布2023-02-26 13:08:54
8620
发布2023-02-26 13:08:54
举报

GPDB中AOCO列存页的checksum

为了保证数据的正确性,AOCO列存页采用CRC32即循环冗余校验算法来进行校验。首先看下页结构。

页类型有四种:AOSmallContentHeader、AOLargeContentHeader、AONonBulkDenseContentHeader和AOBulkDenseContentHeader。页头的大小都是8个字节。除了这些内容外,页头其实还有firstRowNum和checksum,但这两个成员在计算时归到了数据那部分。

下面我们以SmallContentHeader为例来讲解下checksum。

页头部分结构如上图所示。Checksum部分大小为8字节,分为2部分:block checksum与header checksum。首先计算block checksum,其实就是数据部分的checksum:firstRowNum与value部分的crc值;然后再计算header checksum:AoHeader_RegularSize与block checksum部分的crc值。这样通过两个checksum来分别保证页头和数据部分的正确性。

我们看下计算流程:计算时先计算block checksum,存储位置位于第1个crc的位置,计算内容从firstRowNum开始的所有数据。接着计算header checksum,存储位置位于第2个crc位置,计算内容从页头开始一直到第一个crc的结尾。

AppendOnlyStorageFormat_AddBlockHeaderChecksums函数计算checksum:

再看下,什么时候进行校验:

也就是当从磁盘上加载上来列内容后,会立即通过函数

代码语言:javascript
复制
AppendOnlyStorageFormat_VerifyHeaderChecksum

进行页头的checksum校验,然后读取块内容时调用函数

代码语言:javascript
复制
AppendOnlyStorageFormat_VerifyBlockChecksum

进行block checksum校验。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-01-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 yanzongshuaiDBA 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
对象存储
对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档