CPU为了提升执行效率,减少CPU与内存的交互(交互影响CPU效率),一般在CPU上集成了多级缓存架构
cpu读取数据时, 会先从自己的寄存器当中读取.如果没有再从Cache当中读取数据.如果Cache当中也没能.再从内存当中获取.然后再依次缓存
L1 Cache
分为数据缓存和指令缓存,逻辑核独占
CPU所有操作的数据全部在寄存器当中完成
寄存器比L1要快
离CPU内核最近
内核独享
L1一种存指令,一种存数据
L2 Cache
内核独享
L3 Cache
所有内核共享
Registers(寄存器组) `<1ns`
L1 cache (一级缓存) `约1ns`
L2 cache(二级缓存) `约3ns`
L3cache(三级缓存) `约15ns`
主内存(最终存储地址) `约80ns`
1. 缓存是由最小的存储区块缓存行Cache Line组成
2. 计算机当中为了让效率更高,在读取数据时,是一块一块进行读取的
3. cache Line能够读取的大小是64个字节
假设cpu1从主内存当中读取一个共享数据i = 1,读取到cache当中 进行数据的修改,把i修改为2
一、同时同一个cpu也从内存当中读取数据
1.总线加锁
cpu1在读取的时候不允许其它cpu进行读取
弊端: 降低了cpu的吞吐量
2.缓存上的一致性协议MESI
后续再说MESI先有个印象
构建数组
创建一个大的二维数组
任务:两种方式所有元素进行求和
为什么会产生这么多时间呢? 如何进行读取的呢?
分析原理
上面一种连续按行读取
下面一种是按列读取
一个叫局部性原理的问题
一、什么是局部性原理
空间局部性
如果一个存储器的位置被引用,那么将来他附近的位置也会被引用
时间局部性
被引用过一次的存储器位置在未来会被多次引用那么在近期它很可能还会被再次访问