00:01
好,那么下边我们再来看啊,这具体的啊,这这三种具体的技术都是什么?首先说镜像技术,镜像技术啊呃,是我们最容易理解的。啊,其实镜像那那那就是那冗余就指的这个这个镜像啊啊一模一样的给他备份一份呗,对吧,简单看看这啊简单看一下过一下,那镜像技术是指一种冗余技术是吧?为磁盘提供数据的备份功能啊,防止磁盘发生故障而造成数据丢失是吧?对于瑞而言,采用镜像技术最典型的用法就是。同时在磁盘阵列中产生两个完全相同的数据副本。并且分布在两个不同的磁盘上,也就是说我就搞出来。或者搞出来俩东西,这俩东西这俩磁盘是吧,里边放的数据一模一样。
01:02
就这这最简单的。是吧,也是最典型的。那么镜像提供了完全的数据转移能力,当一个数据副本失效不可用时,外部系统仍可正常访问另一个副本,因为你两边数据一模一样嘛,包括对系统的运行和性能产生影响。而且镜像不需要额外的计算和校验。呃,故障修复非常呃,直接复制就可以了。就是说你这俩,因为它里边放的数据一模一样,所以它里边也不存在校验。那数据是一样的,也不用算,不用把数给你算了,这个是我跟你说这句话啊,不用做计算和校验,是说给谁听的,是说给后边的。数据条带技术,数据条带技术和这个数据教育,你让他们听的,让你们看看我多么简单是吧。呃,镜像技术啊,可以从多个副本进行并发读取数据,提高性能。
02:07
啊,但注意但不能并行。写入数据。写多个副本通常会导致一定的IO性能的下降,什么意思呢?就是说这样啊。呃,我们。这不是多个副本嘛,是吧?啊其实大家想一下我们我们很多集群类似于那种集群啊,呃,Master slave是吧?假设就是master是吧,比如我们MY的读写分离集群是吧?读写分离,那这是master,这是slave,这slave那大家想一下平常读数据的时候。是不是他可以对外提供读写两个功能,它只能对外提供读。是不是只能提供?所以这是什么,这他这一个意思就是写入数据啊,只能往一个里边写,然后其他的做什么做数据同步。
03:01
你不要往这里边一写,往这里边儿一写,往这里边都能写,那都能写,都需要做同步,所以它会降低什么,会降低性能,不仅会降低性能啊,我们实现起来也会很复杂。实验起来会很复杂啊这个。得不偿失啊,这种是得不偿失的,所以一般我们不会这样做。然后金像技术,呃,提供了非常高的数据安全性,但是其代价也是非常昂贵的。啊,至少是双倍的存储空间,但是现在硬盘属于硬盘不贵了是吧,所以呢,这个。代价昂贵啊,其实也是相对的。啊,高成本限制了镜像的广泛应用,主要用于呃,至关重要的数据保护这种场,这种场合下数据丢失可能会造成非常巨大的损失,这个啊,我给大家说,基基本上不存在这个问题,就是现在这种磁盘太便宜了。
04:04
你要搞一个啊,很复杂的一个系统,你说我增加了。几百块钱就增加上T。几个T的容量,那你想想那那算钱吗?堆一个上千万。上亿的项目,那算钱吗?是不是你花上几十万块钱愿意扩展你的磁量空间,它它就不算钱啊,它不算钱,所以这个啊,就是我们这种镜像技术用的是要多一些,比后边两种要多,我们这这我们再来说啊,再说这数据条带技术是什么啊。数据条带,呃,数据条带化技术啊,是一种自动将IO操作负载均衡到多个磁盘物理磁盘上的技术。啊,具体说是什么呢?将一块连续的数据分成很多小部分。
05:01
并把它们分别存入到不同的磁盘上。这就能够使多个进程同时并发访问数据的多个不同的部分,从而来提高啊,提高它的IO的这些并行能力啊,提高系统的性能,什么意思是这样。大家看我这儿,比如说有。有四块磁盘。啊,四块硬盘是吧,然后呢,我这儿啊,这个这个这个。这我的数据啊,这个数据。这个数据我要写到磁盘里边。写到磁盘,当然你可以写到一个磁盘,让他们去啊做这个副本,这没问题的。但是那种叫镜像技术,我们现在说的是什么?数据条带技术,它是指什么意思呢?诶,你不是有四个磁盘吗。我把数据宽。夸夸分成四块。然后把这块数据写到它里边。
06:03
这块数据写到它里面。这个数据写在它里边。这块数据写到他里边。这个写的时候就可以怎么并行的来写。就可以。病情难写。这就是数据条带技术。哎,有哥们说了,那你这书籍写在里边是不不连续了,再放在四个磁盘了呀,那是另外的问题。咱们现在说的叫什么,条带技术是什么?就把这些数据我都给你分割了。分割成啊这么几块,然后分别存在不同的磁盘上,这就叫数据调代技术,它怎么样能保证这些数据它的啊连贯性啊,它的有序性,它另外的内容。明白吧,好。再来看啊,数据校验技术,去校验技术,当然大家注意啊,这这对这三种技术的使用啊,我们一会儿到这儿。
07:02
再详细给大家说啊。先了解这这三种技术是什么技术。再说数据校验技术是指的什么?瑞要在写入数据的同时进行校验计算。并将得到的校验数据存储到瑞的成员磁盘中。校验数据可以集中保存在某个磁盘或分散到磁盘的各个不同的磁盘中,当其中一部分数据出错时,就可以对剩余数据和校验数据进行反校验计算。反校验计算啊,然后重建丢失的数据什么意思?这种教育技术比较复杂。它是通过什么,通过把数据啊,你注意。嗯,我还有不同的磁盘啊。不同磁盘。比如说我把数据啊,啊,我这有一块数据,我存到它里边。写到它里边就就行了。
08:01
那我怎么样做备份呢?我把这个数据我给他生成相应的校验数据,比如说我写到。校验数到它里边。校验数据写到它里边,一旦比如说这里边你写进去的这里边儿数据丢了一部分或者丢失了,那么系统会根据这个校验数据干嘛,重新计算出来这里边的数据。重新计算出来这里边儿的数据。把这个数据给你恢复。所以从大家一想就知道它是比较复杂的呀,这个数据不是一模一样备份到它里边的,而是什么。计算出来,他可以重新再计算出来,得到一份,这是什么校验?所以数据校验技术啊,相对于镜像技术的优势在于什么?节省大量的开销,就是你测量空间省了。但由于每次数据读写都要进行大量的校验运算,对计算机的运行速度要求很高。
09:09
且必须使用硬件read。控制器就是必须要用硬件控制器的,你看我们一会儿要给大家说这个锐的分类啊,它有软锐的,硬锐的,混合锐的,它是要求必须是什么硬锐的。啊,在数据重建恢复方面,这个校验技术比镜像技术复杂且慢得多。所以这种它它是一种。啊,数据安全技术,但这个呢。相对于现在来说,它的开销系统开销太大了。虽然省下了磁盘了。但它系统开销很大。对,你的CPU啊。对你的处理器要求很高啊,他大量的运算呢,对不对,虽然省了空间了,但是CPU浪费太大了,那CPU比磁盘贵得多。
10:02
所以这种事情并不实用。太慢。实际上成本高。对不对啊,这是啊,这这三种关键技术,大家先先来了解一下是怎怎么用的是吧?啊或者说是什么啊,我们一会儿在里边再说怎么用啊。那么我们在这再,呃,因为今今天这说完这个硬件RAID控制器啊,我们在这再简单的把这个RAID分类说一下。啊瑞的分类分三类,软类,软锐的,硬锐的和混合瑞的。软瑞的所有的功能操作呃,都是由操作系统和CPU完成的,没有独立的RAID控制器,处理芯片和IO处理芯片。啊,所以效率自然就低了,就纯纯粹是软件。完成的。然后锐的呢,配置了专门的的控制器处理芯片和IO处理芯片,以及。
11:01
这个阵列缓冲。我占CP资源效率很高,但是你配了专门的硬件了,它成本很高。它的成本很高。然后混合的啊,具备瑞的控制器处理芯片,但没有专门的IO处理芯片,需要CPU和驱动程序来完成,也就是说它需要介入你本地的CPU来完成。性能和成本介于锐和软瑞和硬锐的之间。说实话。现在企业里边我们用一般用都是硬味的。这个东西不是很贵。他也不是很贵啊,就是对于我们整体项目这个经费来说,呃,这都。毛毛雨啦,是不是小菜一碟啦啊,所以呃,你了解到这些就可以了啊,嗯,因为现在对现在的系统来说,现在的平台来说,什么是最重要的。效率是第一位的。效率是第一位的。
12:02
OK啊,这是我们说到的关键技术和RAID分类。
我来说两句