专栏首页业余草Cache 和 Buffer 都是缓存,主要区别是什么?

Cache 和 Buffer 都是缓存,主要区别是什么?

原文链接:https://www.zhihu.com/question/26190832/answer/830615125

提到这个问题,可能意味着题主意识到了两者的相关性。的确,他们确实有那么一些联系。

首先cache是缓存,buffer是缓冲,虽然翻译有那么一个字的不同,但这不是重点。

个人认为他们最直观的区别在于cache是随机访问,buffer往往是顺序访问。虽然这样说并没有直击本质,不过我们可以待分析完毕之后再来讨论真正的本质。

为了说明这个问题,让我将他们分开来说:read cache(读缓存),read buffer(读缓冲),write cache(写缓存),write buffer(写缓冲)。

无论缓存还是缓冲,其实本质上解决的都是读写速度不匹配的问题,从这个角度,他们非常相似。

首先讨论读缓存跟读缓冲。

读缓存跟读缓冲的最大区别在于,读缓存的目标数据是始终有效的,如果不从缓存中读取,也可以直接读取实际数据,只不过实际数据读取会慢一些,当这个数据在缓存中,读取速度将会变快。

当一个缓存中的数据被多次读取,实际上就减少了该数据从慢速设备中读取的量,这就存在某种算法去选择「什么数据需要保存在cache中」,因为尽可能多的让cache命中能提高性能。

先进入cache的数据不一定先被读取,甚至说进入cache的数据有可能永远不被读取就被清除了,因此read cache呈现出非常明显的随机访问特性。

而读缓冲buffer的数据则不是始终有效,而是实时生成的数据流,每当buffer满或者主动flush buffer的时候触发一次读取,对于小数据,这样可以减少读取次数,对于大数据,这可以控制单次读取的数据量。

换句话说,无论数据量大还是小,单次读取数据量都按照buffer尺寸进行归一化了。通常来说,先喂给buffer的数据一定会先被读取,所有buffer的数据几乎一定会被读取,这是很明显的顺序访问特性。

从上面的情况看到,读缓存以及读缓冲很明确的反应出了我所说的表面特性。而其本质特性在于cache的目标是减少读取总量每次cache命中都减小了读取总量。

而buffer并不能减少读取总量,只能规整化每次读取数据的尺寸大小。

要说到write cache跟write buffer?

我们先说write buffer,write buffer是read buffer的对应,对于小数据的写入,它需要填满write buffer再进行一次写入,对于大数据,大数据会被分割到buffer尺寸的大小分批写入。

因此,write buffer 的用处在于使得每次写入的数据量相对固定。如果一次写入4k对某个设备来说效率最高,那么把buffer定为4k,小数据积攒到4k写一次,大数据分割到每个碎片4k多次写入,这样就是write buffer的用处。

最后我们来说write cache。所谓write cache,就是要设法减少写入次数。也就是说,如果某些数据需要产生多次写入,那么使用cache就可以只将最终数据写入,导致最终写入数据减少。

在实际应用中,我们有时会使用到write buffer跟write cache的合体形态。buffer本身需要规整尺寸,与此同时,buffer还允许多次随机写入,使得多次写入的数据只用写入最后一次,这属于cache的特性。

BT软件使用的写缓存往往具有类似特性,因而这种形态它同时既是buffer又是cache。

正因为在写入场合buffer跟cache没有那么明显的分界,所以才会有产生buffer跟cache究竟有啥区别的疑问。

结论

在read(读取)的场合,cache通常被用于减少重复读取数据时的开销,而buffer则用于规整化每次读取数据的尺寸,在读取场合两者用途差别很大。

在write(写入)的场合,两者功能依然没变,但由于cache跟buffer的功能在写入场合可以融合使用,所以两者可以被混淆,写入缓冲跟写入缓存往往会同时担当规整化写入尺寸以及减少写入次数的功能,所以两者有时会被混淆,但这只是个名称问题,没有原则性关系。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 如何在windows下和linux下获取文件(如exe文件)的详细信息和属性

    最近在项目开发中,由cs开发的exe的程序,需要自动升级,该exe程序放在linux下,自动升级时检测不到该exe程序的版本号信息,但是我们客户端的exe程序需...

    业余草
  • MySQL亿级大表优化实战....

    XX 实例(一主一从)xxx 告警中每天凌晨在报 SLA 报警,该报警的意思是存在一定的主从延迟。(若在此时发生主从切换,需要长时间才可以完成切换,要追延迟来保...

    业余草
  • 关于 InnoDB 存储引擎的一些总结!

    时间过的很快,一眨眼一年时间就过去了。过去一年里,我也和群里的不少朋友一起成长,互相学习到不少东西!下面总结一些,我们经常在群里讨论的一些关于 MySQL 的知...

    业余草
  • Cache 和 Buffer 都是缓存,主要区别是什么?

    首先cache是缓存,buffer是缓冲,虽然翻译有那么一个字的不同,但这不是重点。

    良月柒
  • Cache 和 Buffer 都是缓存,主要区别是什么?

    提到这个问题,可能意味着题主意识到了两者的相关性。的确,他们确实有那么一些联系。

    老钱
  • 驶上快车道的微博,逐鹿内容市场将迎来更多对手

    今天微博发布了Q1财报,最大亮点便是用户数爆发式增长:MAU达到2.61亿,同比增长32%,DAU达到1.2亿,同比增长35%。与上一季度相比,微博月活跃用户净...

    罗超频道
  • 《Head First 设计模式》学习心得笔记

    版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/...

    剑影啸清寒
  • 【译】JSX 如何生成 HTML 元素?

    JSX 使 我们更容易编写 React 组件。 有些人可能会发现 JSX 具有很陡峭的学习曲线,这是完全可以理解的。 它不完全是 HTML,也不完全是 Java...

    腾讯IVWEB团队
  • 数据结构与算法——稀疏数组

    当一个数组(包括多维数组)中的大部分元素为0或者为同一个数值的数组时,为了节约空间起到压缩的效果,将数据用另一种结构来表示,即稀疏数组。

    C you again 的博客
  • CentOS 7 解决丢失 nginx.pid

    出现错误就要解决错误。从上图中可以看出,错误原因是缺少 nginx.pid 这个文件,这个文件中的内容只有一行,记录的是相应进程的 pid,即进程号。 解决的...

    用户7657330

扫码关注云+社区

领取腾讯云代金券