前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >计算机中的层次化存储究竟是个什么鬼?

计算机中的层次化存储究竟是个什么鬼?

作者头像
冰河
发布2021-02-05 16:32:26
4560
发布2021-02-05 16:32:26
举报
文章被收录于专栏:冰河技术冰河技术

作者个人研发的在高并发场景下,提供的简单、稳定、可扩展的延迟消息队列框架,具有精准的定时任务和延迟队列处理功能。自开源半年多以来,已成功为十几家中小型企业提供了精准定时调度方案,经受住了生产环境的考验。为使更多童鞋受益,现给出开源框架地址:

https://github.com/sunshinelyz/mykit-delay

PS: 欢迎各位Star源码,也可以pr你牛逼哄哄的代码。

写在前面

撸代码只是程序员的一项最基本的技能,除此之外,还有很多知识需要程序员掌握。【程序员进阶系列】专题,旨在分享程序员想要进一步提升自我,突破发展瓶颈的一系列技术。今天,我们来一起聊聊计算机中的层次化存储结构。

文章已收录到:

https://github.com/sunshinelyz/technology-binghe

https://gitee.com/binghe001/technology-binghe

层次化存储结构

首先,问小伙伴们一个问题:计算机的存储结构为什么需要进行层次化的划分呢?

说的直接一点:就是为了减少经济成本。如果说,CPU的价格非常便宜的话,根本就不需要内存了。可以把所有的内存容量全部都做到CPU里面去,就可以了。但是,事实上,CPU的内存是很金贵的,至今为止,CPU中基本上还是一级缓存和二级缓存。三级缓存比较少见。而且,CPU中的存储容量是非常小的,基本都是KB级别的存储,CPU的内存容量也就几KB,MB级别的CPU内存也是比较少见的。所以,出于经济成本的考虑,计算机中的存储结构是按照层次进行划分的。

为了能够让小伙伴们更加清晰的理解层次化存储结构,我们先来看一张图。

由上图,可以看出:

(1)层次化的存储结构可以分为:CPU、Cache(高速缓存)、主存(内存)、外存(辅存)。

(2)从上往下,速度越来越慢,容量越来越大。

局部性原理是层次化存储结构的支撑。

局部性原理

一个编写良好的计算机程序常常具有良好的局部性。也就是说。它们倾向于引用临近于其他最近引用过的数据项的数据项,或者最近引用过的数据项本身。这汇总倾向性,就被称为局部性原理,这是一个持久的概念,对硬件和软件系统的设计和性能都有着极大的影响。

之所以有这个规律,很多人认为原因是:程序的指令大部分时间是顺序执行的,而且程序的集合,如数组等各种数据结构是连续存放的。

局部性原理讲的是:在一段时间内,整个程序的执行仅限于程序的某一部分,相应地,程序访问的存储空间也局限于某个内存区域。主要分为两类:

  • 时间局部性:如果程序中的某条指令一旦执行,则不久之后该指令可能再次被执行;如果某数据被访问,则不久之后该数据可能再次被访问。
  • 空间局部性:是指一旦程序访问了某个存储单元,则不久之后,其附近的存储单元也将被访问。

Cache

针对Cache相关的技术,我们主要来聊聊Cache的概念和映像相关的技术。

Cache-概念

这里的Cache表示的是高速缓冲,在计算机的存储体系系统中,Cache是除寄存器外访问速度最快的层次。使用Cache改善系统性能的依据是程序的局部性原理

如果以h代表对Cache的访问命中率,t1表示Cache的周期时间,t2表示主存储器的周期时间,以读操作为例,使用“Cache+主存储器”的系统的平均周期为t3,则可以得出如下运算公式。

代码语言:javascript
复制
t3 = h * t1 + (1 - h) * t2 

其中。(1 - h)又称为失效率,也就是未命中率。

Cache-映像

Cache的映像分为三种,分别是:直接相联映像、全相联映像、组相联映像。

  • 直接相联映像:硬件电路比较简单,但冲突率最高。
  • 全相连映像:电路难于设计和实现,只适用于小容量的Cache,冲突率比较低。
  • 组相联映像:直接相联与全相联的折中。

地址映像是将主存与Cache的存储空间划分为若干大小相同的页(或称为块)。

例如,一台计算机的主存容量为1GB,划分为2048页,每页512KB;Cache的容量为8MB,划分为16页,每页512KB。接下来,我们由此来详细图解直接相联映像、全相联映像和组相联映像。

直接相联映像

我们可以画一组图来表示Cache的直接映像。首先,我们先来简单画一个主存标记、Cache页号和页内地址的示意图。如下所示。

如上图所示,主存标记为7位,Cache页号为4位,页内地址为19位。

记录主存区号的示意图如下所示。

有了上面两张图的基础后,我们再来看直接相联映像的示意图如下所示。

这里,我们将容量为1GB的主存划分成2048页,总共127个区,每页的容量为512KB。将容量为8MB的Cache划分为16页,每页容量为512KB。

所谓直接相联映像是指Cache中的0页只能存储主存中0页的内容,这里主存中0页指的是每个区的0页,比如上图中的0区的0页,1区的16页,127区的2032页等。

在直接相联映像中,只需要记录主存标记、Cache页号和页内地址就能够快速的找到主存中的数据。

使用直接相联映像有个缺点:那就是如果Cache中的0页,存储了主存中0区0页的内容时,如果此时需要存储主存1区中的16页内容,就只能将主存0区中0页的内容从Cache的0页中清除,然后将主存1区中16页的内容存储到Cache中的0页内。冲突率比较高。细心的小伙伴会发现:这其实是违背局部性原理的。

直接相联映像访问速度最快,但冲突率最高。

全相连映像

我们先来看下全相联映像的主存页标记和页内地址的示意图,如下所示。

此时,使用11位来标识主存页标记,使用19位来标识页内地址。

使用全相连映像需要记录主存与Cache的对应关系,如下图所示。

接下来,我们来看看全相连映像的示意图,如下所示。

从图中可以看出,Cache中的任何一个也,都可以存储主存中的任何一个页。

使用全相连映像访问速度最慢,冲突率最低。

组相联映像

组相联映像本质上是直接相联映像和全相联映像的折中。同样的,我们先来看组相连映像的存储示意图。

此时,在组相连映像中,Cache组号使用3位表示,组内页号使用1位表示,页内地址使用19位表示。其中,3位的Cache组号,1位的组内页号和前面的7位构成了主存页标记;3位的Cache组号,1位的组内页号和19号的页内地址构成了Cache地址。

接下来,我们再来看看主存与Cache的对应关系,如下图所示。

组相连的映像示意图如下所示。

由上图可知,在组相连映像中,主存的组与Cache的组是直接相联映像关联,而在组内则是通过全相联映像来访问和存储数据。

好了,我已经肝不动了。今天就到这儿吧,我是冰河,大家有啥问题可以在下方留言

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-02-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 冰河技术 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 写在前面
  • 层次化存储结构
  • 局部性原理
  • Cache
    • Cache-概念
      • Cache-映像
        • 直接相联映像
          • 全相连映像
            • 组相联映像
            相关产品与服务
            对象存储
            对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
            领券
            问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档