前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >InnoDB中的INT怎么存储的

InnoDB中的INT怎么存储的

作者头像
老叶茶馆
发布2020-07-10 11:26:05
9100
发布2020-07-10 11:26:05
举报

作者:高鹏(网名八怪),《深入理解MySQL主从原理32讲》系列的作者。 系列链接:https://www.jianshu.com/nb/43148932

一、问题来源二、源码部分三、实例解析1. 有符号2、无符号四、测试延伸阅读

一、问题来源

如果我们查看show egnine innodb查看锁记录的时候往往会看到Innodb的数字使用类似 80000001的形式显示如下:

代码语言:javascript
复制
Record lock, heap no 2 PHYSICAL RECORD: n_fields 4; compact format; info bits 0
 0: len 1; hex 31; asc 1;;
 1: len 1; hex 31; asc 1;;
 2: len 1; hex 80; asc  ;;
 3: len 8; hex 8000000000000001; asc         ;;

这里是一个有符号的bigint的显示。本文就来说一下这个值是这么计算出来的。本文以4字节的int为例。

二、源码部分

关于转换的部分主要集中在函数 row_mysql_store_col_in_innobase_format 中,我们来看一下数字的转换代码如下:

代码语言:javascript
复制
if (type == DATA_INT) {
        /* Store integer data in Innobase in a big-endian format,
        sign bit negated if the data is a signed integer. In MySQL,
        integers are stored in a little-endian format. */

        //p指针指向buf的最高地址,反向获取数据得到大端buffer时
        byte*   p = buf + col_len; 

        for (;;) {
            p--;
            *p = *mysql_data; //转大端 
            if (p == buf) { //如果存储完成 
                break;
            }
            mysql_data++;
        }

        if (!(dtype->prtype & DATA_UNSIGNED)) {//如果为有符号类型

            *buf ^= 128;
        }

        ptr = buf; //PTR指向 buffer低地址
        buf += col_len;//buf指向 buffer的高地址
    } 
...

//存入dtuple中,里面很简单就是取void* 存进去进行了。
dfield_set_data(dfield, ptr, col_len);

这里的关键部分就是对于有 *buf ^= 128 这部分,实际上就是转换为大端后的最低位做一个异或操作。 最终操作为函数 page_cur_tuple_insert 会将这个dtuple插入到实际的数据文件其中有一个函数为 rec_convert_dtuple_to_rec_comp,会获得最终的物理记录,其中的代码memcpy(end, dfield_get_data(field), len),可以看到实际存入物理记录的就是这里的转换后的值。

三、实例解析

1. 有符号

正数:以数字5为例子,其4字节的表示方法为0x05 0x00 0x00 0x00,这里还是小端形式为MySQL层传入的值。Innodb转换方式如下:

  • 从高地址开始取,转换为大端形式,转换后为 0x00 0x00 0x00 0x05
  • 如果为有符号类型转换为大端后的最低位做一个异或操,转换为 0x80 0x00 0x00 0x05

负数:以数字-5为例子,其4字节的表示方法为0xfb 0xff 0xff 0xff(补码),这里还是小端形式为MySQL层传入的值。Innodb转换方式如下:

  • 从高地址开始取,转换为大端,转换后为 0xff 0xff 0xff 0xfb
  • 如果为有符号类型转换为大端后的最低位做一个异或操,转换为 0x7f 0xff 0xff 0xfb
2、无符号

这个比较简单,直接原始值大端输出即可,不做最后的异或操作。

四、测试

我们为了测试就建立一个表如下:

代码语言:javascript
复制
create table testint(id int primary key);
insert into testint values(5),(-5);

然后使用innblock和bcview查看二进制文件中存储的方式。

第一行记录为:

转换如下:

代码语言:javascript
复制
80000005 实际记录5
000000014224 trx id
bd000000230110 roll ptr

第二行记录为:

代码语言:javascript
复制
7ffffffb 实际记录-5
000000014224 trx id 
bd00000023011d roll ptr

我们可以发现我们的分析是正确,确实物理文件中也是这样存储的。

延伸阅读

  • InnoDB表聚集索引层高什么时候发生变化
  • 浅析InnoDB索引结构
  • Innodb页合并和页分裂
  • innblock | InnoDB page观察利器
  • jcole.us:The physical structure of InnoDB index pages
  • jcole.us:B+Tree index structures in InnoDB

Enjoy MySQL :)

全文完。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-07-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 老叶茶馆 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、问题来源
  • 二、源码部分
  • 三、实例解析
    • 1. 有符号
      • 2、无符号
      • 四、测试
      • 延伸阅读
      相关产品与服务
      云数据库 SQL Server
      腾讯云数据库 SQL Server (TencentDB for SQL Server)是业界最常用的商用数据库之一,对基于 Windows 架构的应用程序具有完美的支持。TencentDB for SQL Server 拥有微软正版授权,可持续为用户提供最新的功能,避免未授权使用软件的风险。具有即开即用、稳定可靠、安全运行、弹性扩缩等特点。
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档