首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    深入理解mmap 0拷贝技术

    我们知道,linux系统中用户空间和内核空间是隔离的,用户空间程序不能随意的访问内核空间数据,只能通过中断或者异常的方式进入内核态,一般情况下,我们使用copy_to_user和copy_from_user等内核api来实现用户空间和内核空间的数据拷贝,但是像显存这样的设备如果也采用这样的方式就显的效率非常底下,因为用户经常需要在屏幕上进行绘制,要消除这种复制的操作就需要应用程序直接能够访问显存,但是显存被映射到内核空间,应用程序是没有访问权限的,如果显存也能同时映射到用户空间那就不需要拷贝操作了,于是字符设备中提供了mmap接口,可以将内核空间映射的那块物理内存再次映射到用户空间,这样用户空间就可以直接访问不需要任何拷贝操作,这就是我们今天要说的0拷贝技术。

    01

    【参加CUDA线上训练营】--储存单元及矩阵乘法

    GPU的存储单元分为两大类: 板子上芯片周围的显存颗粒(on board),读取速度相对慢,如下图中的local memory,global memory,constant memory,texture memory。 在GPU芯片内部(on chip),读取速度相对快,如下图中 下图中的箭头双向表示可以读写,单向表示只能读。这些memory可以进一步细分: R/W可读可写memory: registers、local memory:线程私有memory,每个线程私有访问。 shared memory:一个block内的线程都可以访问,可以数据共享通信。 global memory:每个线程都可以读写。 R 只读memory:constant memory,texture memory是每个线程都可以读。 global memory,constant memory,texture memory和主机之间都可以通信读写,通常显卡说明书写的显存大小,就是global memory

    01

    GPU功耗管理方式介绍(Linux)

    Management PCI-Express Runtime D3 (RTD3) Power Management是一种用于管理PCI-Express设备的低功耗模式的技术RTD3是一种睡眠状态,当PCI-Express设备处于空闲状态时,可以将其置于低功耗模式,以减少能源消耗和热量产生。英伟达™(NVIDIA®)图形处理器有许多省电机制。其中一些机制会降低芯片不同部分的时钟和电压,在某些情况下还会完全关闭芯片部分的时钟或电源,但不会影响功能或继续运行,只是速度较慢。然而,英伟达™(NVIDIA®)GPU 的最低能耗状态需要关闭整个芯片的电源,通常是通过调用 ACPI 来实现。这显然会影响功能。在关机状态下,GPU 无法运行任何功能。必须注意的是,只有在 GPU 上没有运行任何工作负载的情况下才能进入这种状态,而且在试图开始工作或进行任何内存映射 I/O (MMIO) 访问之前,必须先重新开启 GPU 并恢复任何必要的状态。

    04
    领券