前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >内核必须懂(七): Linux四级页表(x64)

内核必须懂(七): Linux四级页表(x64)

作者头像
sean_yang
发布2019-05-07 14:27:15
6.8K0
发布2019-05-07 14:27:15
举报
文章被收录于专栏:Sorrower的专栏Sorrower的专栏

目录

  • 前言
  • Intel四级页表
  • 实操寻址
  • 获取cr3
  • 获取PGD
  • 获取PUD
  • 获取PMD
  • 获取PTE
  • 获取内容
  • 最后

前言

Linux四级页表的作用主要就是地址映射, 将逻辑地址映射到物理地址. 很多时候, 有些地方想不明白就可以查看实际物理地址进行分析.


Intel 四级页表

其实很多设计的根源或者说原因都来自于CPU的设计, OS很多时候都是辅助CPU. Linux的四级页表就是依据CPU的四级页表来设计的. 这里主要说的就是Intel x64页面大小为4KB的情况, 如图所示:

当然, 你可以用指令确认下:

代码语言:javascript
复制
getconf PAGE_SIZE 

实操寻址

首先这里先贴出几个工具, fileview, dram, registers. 这些都是可以帮助快速获取地址的, 上一篇文章说的kgdb工具也是可以的, 就是麻烦一点, 你懂的. 具体内容就不贴了, 这里仅展示用户态的代码:

代码语言:javascript
复制
#include <stdio.h>
#include <fcntl.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/stat.h>
#include <sys/types.h>

#define BUFSIZE 4096

int main()
{
    int         fd, ret;
    char            buf[BUFSIZE];
    unsigned long int   a = 0x1234567890abcdef;
    printf( "a=0x%016lX addr: %p \n", a, &a );

    if ( (fd = open( "/proc/registers", O_RDONLY ) ) < 0 )
    {
        fprintf( stderr, "Open /proc/registers file failed! \n" );
        exit( EXIT_FAILURE );
    }

    lseek( fd, 0L, SEEK_SET );

    if ( (ret = read( fd, buf, sizeof buf - 1 ) ) < 0 )
    {
        perror( "/proc/registers" );
        exit( EXIT_FAILURE );
    }

    buf[ret] = 0;
    close( fd );
    puts( buf );

    while ( 1 );
    return(0);
}

使用make指令编译工具, 插入dram.ko和registers.ko驱动模块. 编译运行用户态程序, 如图所示:


获取cr3

这之中最关键的是cr3地址以及局部变量地址, 这里看到, 变量地址是0x7ffdcbffaba8, 变量值是0x1234567890ABCDEF. cr3寄存器中地址是0x40c78000. 当然了, 按照CPU的图示, cr3肯定是指向PML4E. 在Linux当中, 第一级页表称为PGD, 当然是有历史原因的, 可以自行google. 所以Linux的四级页表分别是PGD -> PUD -> PMD -> PTE.


获取PGD

想要获取PGD中的内容需要通过计算. 这里先来处理一下局部变量地址. 首先写成二进制.

代码语言:javascript
复制
0x7ffdcbffaba8
0111 1111 1111 1101 1100 1011 1111 1111 1010 1011 1010 1000

然后按照Intel的设计, 重新整合.

代码语言:javascript
复制
011111111 111110111 001011111 111111010 101110101000

重新写成16进制:

代码语言:javascript
复制
ff 1f7 5f 1fa ba8

这就是只要用的offset. 因为每个单元是64-bits因此需要在序号基础上乘以8获得地址. 所以PGD地址为:

代码语言:javascript
复制
0x40c78000(cr3) + ff * 8 = 0x40c787f8

然后使用启动之前编译的小工具:

代码语言:javascript
复制
./fileview /dev/dram

输入之前计算出来的地址0x40c787f8, 就可以得到之中的内容, 也就是PUD, 从CPU图来说就是PDPTE:


获取PUD

这里获取到的是67 50 75 76 00 00 00 80, 但是注意, Intel是和显示顺序反过来的. 也就是76755067, 然后后面的12-bits是页面属性. 所以, 具体地址就是:

代码语言:javascript
复制
76755000 + 1f7 * 8 = 76755fb8

同样输入地址到工具, 得到67 80 E8 2C 00 00 00 00.


获取PMD

直接计算了:

代码语言:javascript
复制
2ce88000 + 5f * 8 = 2ce882f8

得到67 00 DD 48 00 00 00 00.


获取PTE

直接计算了:

代码语言:javascript
复制
48dd0000 + 1fa * 8 = 48dd0fd0

得到67 58 59 20 00 00 00 80.

获取内容

最后就可以获取到内容了:

代码语言:javascript
复制
20595000 + ba8 = 20595ba8

最后

当然了, 这次是在用户态下进行从线性地址到物理地址转换的, 如果是内核态有些地方会发生变化. 暂时写到这里, 内核态等后续的更新了. 喜欢记得点赞, 有意见或者建议评论区见~


本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2019.04.22 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 目录
  • 前言
  • Intel 四级页表
  • 实操寻址
    • 获取cr3
      • 获取PGD
        • 获取PUD
          • 获取PMD
            • 获取PTE
              • 获取内容
              • 最后
              领券
              问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档