专栏首页虚拟化笔记IOMMU(四)-dma remapping
原创

IOMMU(四)-dma remapping

惠伟:IOMMU(三)-初始化​zhuanlan.zhihu.com

DMA remapping就是在DMA的过程中IOMMU进行了一次转换,MMU把CPU的虚拟地址(va)转换成物理地址(pa),IOMMU的作用就是把DMA的虚拟地址(iova)转换成物理地址(pa),MMU转换时用到了pagetable,IOMMU转换也要用到io pagetable,两者都是软件负责创建pagetable,硬件负责转换。IOMMU的作用就是限制DMA可操作的物理内存范围,当一个PCI设备passthrough给虚拟机后,PCI设备DMA的目的地址是虚拟机指定的,必须要有IOMMU限制这个PCI设备只能操作虚拟机用到的物理内存。

intel vt-d spec是IOMMU的标准,标准中一个domain就是一个隔离的空间,一个虚拟机就是一个domain,一个DPDK进行就是一个domain,一个PCI设备分配给这个domain后只能操作这个domain的物理内存。

io pagetable

IOMMU的pagetable和MMU的pagetable一模一样,转换方式也一样,都支持4KB/2M/1G大小的page,都支持4级和5级页表,4级和5级的区别就是va/iova的长度是48位还57位。

DMA类型

  • Requests without address-space-identifier

DMA中只带了source-id,也就是PCI设备的bus/dev/funtion。

  • Requests with address-space-identifier

DMA中除了source-id还有PASID,而这个PASID来自于PCIE config space中的PASID Capability,它是软件配置到PCIE config space中的。

转换类型

intel vt-d IOMMU支持四种转换类型

first level/second level/nested /passthrough translation

  • first level translation

类似于MMU页表,有可能出现页面不存在/权限不够等问题。

  • second level translation

类似于MMU页表,有可能出现页面不存在/权限不够等问题。

  • nested translation

类似于vt-x中的EPT,first level任何一级查到的结果是个中间值,并不是真正的物理地址,需要second level再转换一次才能得到真正的物理地址,比如有一个指针指向first level的PML4E,这个指针指向的并不是真正的物理地址,只有经过second level转换一下才能变成真正的物理地址,才能获取first level的PML4E表,从PML4E中得到PDPE指针,这个指针也需要second level进行一次转换,才是真正存放PDPE表的物理地址,依次类推。

  • passthrough translation

跳过转换,DMA的iova就是pa。

IOMMU工作模式

intel vt-d iommu可以工作于legacy和scale模式。

  • legacy mode

Root Table Address Register指向root table,它中translation Table Mode是00b,root table和conext table是真正的物理地址。legacy mode采用Requests without address-space-identifier,DMA中带有bus/dev/function,bus查root table,dev和function查context table,context table结果指向second level pagetable,查pagetable得到最终的物理地址。

scale mode

Root Table Address Register指向root table,它中ranslation Table Mode是01b,root/context/PASID-directory/PASID-tables是真正的物理地址。scale mode同时支持Requests without address-space-identifier和Requests with address-space-identifier,如果没有PASID,那么就取context table中默认的RID_PASID。bus查root table,dev和function查context table,context table的结果指向PASID directory,PASID directory的结果指向PASID table,PASID table的结果同时包含first level pagetable, second level pagetable和PASID Granular Translation Type (PGTT),PGTT中指明进行first level/second level/nested/passthrough translation。

总结

先了解大体原理,有时间再补充细节和代码。

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

关注作者,阅读全部精彩内容

我来说两句

0 条评论
登录 后参与评论

相关文章

  • IOMMU(五)-interrupt remmaping

    惠伟:IOMMU(四)-dma remapping​zhuanlan.zhihu.com

    惠伟
  • IOMMU(三)-初始化

    BIOS收集IOMMU相关的信息,通过ACPI中的特定表组织数据,放置在内存中,等操作系统接管硬件后,它会加载驱动,驱动再详细解析ACPI表中的信息。

    惠伟
  • IOMMU(二)-从配置说起

    做过DPDK/SPDK开发或者用kvm做过pci passthrough的一定知道以下的配置:

    惠伟
  • DMA和IOMMU(一)-简单介绍

    DMA全称Direct Memory Access,CPU访问外设内存很慢,如果由CPU给外设大量搬运数据,CPU会大量空转等待搬运数据完成,所以发明出DMA ...

    惠伟
  • x86中断和中断虚拟化

    网上有很多写中断虚拟化的博客,讲qemu/kvm是怎么模拟中断的,贴了大段大段的代码,看起来很吃力,对于一个虚拟化新手来说太困难太困难,我这儿写点简单的,讲讲中...

    惠伟
  • ARM SMMU的原理与IOMMU

    如上图所示,smmu 的作用和mmu 类似,mmu作用是替cpu翻译页表将进程的虚拟地址转换成cpu可以识别的物理地址。同理,smmu的作用就是替设备将dma请...

    Linux阅码场
  • VFIO(Virtual Function IO)研究

    VFIO的全称是Virtual Function IO,但这个名字并不能反应它的特点,以下两个假名字更能反应VFIO的特点:

    Linux阅码场
  • 宋宝华:那些年你误会的Linux DMA(关于Linux DMA ZONE和API最透彻的一篇)

    互联网、Linux内核书籍上充满了各种关于Linux DMA ZONE和dma_alloc_coherent、dma_map_single等的各种讲解,由于很多...

    Linux阅码场
  • 新发现的 thunderclap 漏洞允许黑客使用 Thunderbolt/USB-C 外设攻击 PC

    2月28日早些时候由剑桥大学计算机科学与技术系、莱斯大学和斯坦福国际研究所的一组研究人员公布一个新漏洞Thunderclap,影响所有主要平台,包括MacOS和...

    C4rpeDime

扫码关注云+社区

领取腾讯云代金券