00:00
大家好,欢迎大家继续收看上规谷的Linux云计算课程,我是沈超老师,我薛文阳老师,那这节课开始呢,我们来看第二种分类方法,通过存储不同的存储技术,它应该怎么来分,嗯,好,那关于存储技术相关的名词呢,大家可以看到还是很少,还是很多,我们上上节课已经把三个给去掉,那你会发现,诶,怎么还有那么多,其实大家不要去对它有抵触啊,他这里面讲的东西其实很大一部分都是重复的概念,就是是不同的厂家跟他不同的叫法,对其实讲的有可能他两个是一个东西,对对,比如小明和张明,其实可能是一个人,就是李明和小明是同一,明和狗哨是一个人,不能在不能对对对对对啊,那分布式存储呢,对象存储其实可以理解为是一个东西,包括存储桶,就是不同公司的叫法而已,那文件存储和网络存储啊,又是一个东西,快存储,快设备,它只是一个不同储,怎么存?
01:00
嗯,对,不同说法而已,好,那接下来呢,我们就去看第一个啊快,其实这个就是我们之前说过的,这个其实就是本地硬盘,对吧,它是通过硬盘来存储了,优点呢,就是它是最常见的,也是我们所有最高端的什么各种存储技术,最必要的底层支持,你数据最终还是要放在硬盘之上,对吧,那普通的,如果这个普通硬盘呢,它可能性能是比较差的,比如说不支持扩容啊,不支持这个容错啊,换了一块硬盘数据就丢了,那这种情况下,其实我们是可以通过什么我们一些这个这些年开发出来的这种技术,Read啊,磁盘阵列LM逻辑卷管理这样的技术来提供什么,瑞德可以,最主要的是可以提供磁盘容错功能,LM可以提供,最主要的就是扩容功能啊,这是这是linus的Windows有对应的啊,有类似的,那我们就说linus的,然后呢,优点是可以独立使用,诶,一块硬盘就可以放置来用,而且简单方便,插上就。
02:00
常用对吧?对,这就是最常见的这种存储设备啊,那么缺点呢,不利于共享,什么意思,它这个东西啊,是需要不同的操作系统,是需对应不同的文件系统,对吧?写个文件得了啊,比如说我们linus的这个这个原六以前的标配的是EST文件系统,而Windows是NTFS文件系统,那这两个呢,如果是你的硬盘插到Linux,硬盘插到Windows上好吧。它是不是就没办法直接使用了,他要格式化了,那要格式化的话,数据干嘛也没了,所以它是没办法直接使用了,也就是说你如果拿硬盘直接使用,首先要做的事情就是解决文件系统的问题,你先要确认文件系统,也就说格式化步骤是干嘛是必不可少了,对吧,而为这,所以这会导致它的共享,就是说很麻烦,当然如果我们后面加了网络,我们说加了网络存储,哪怕就是我们最简单的,呃,这个桑ma或者这个,其实这几个都很简单,那这个时候它就会干嘛,你Windows linus访问Windows Windows访问linus,你不用管它的这个真实硬盘上这个文件系统是什么样的文件系统,对吧?文件系统都教给我们的方或者是这类的软件去解决,你就直接交给这个协议,这个协议呢,它本身它就会支持什么不同的什么啊,这个文件系统都可以识别跨平台的嘛,对吧,你就只要告诉他我要读哪一个IP的哪一个数据读过来,对方允许你就访问就行了。
03:32
这个时候共享起来就会方便很多,对吧?这是我们块存储的缺陷啊,优点和缺点啊,当然虽然说它的缺点有有,优点也有,但是你记得就算我们后边的这种存储都需要依赖于块存储的存在,对吧?对,这是必不可少的啊。好,那我们这里就来看看这个文件存储和网络存储是吧,那其实这东西说白了就是什么。我们常用的文件服务器对吧?那我们Linux下主要常见的文件服务器是三种,三把FTP和NFS,这个东西其实我们在之前这个网络课程里面干嘛,我们是不是已经详细学习过,对对,他们之间稍有一些区别啊,桑巴主要是可以用Windows和linus共享都可以,但是呢是跨平台了,但是呢它只能应用于局域网,而FTP呢,是可以跨平台,Windows linus都可以用,但是呢,它只能应用于,它只能应用于这个,它可以应用于公网和局域网,两种都可以,那NFS呢,是只能应用于linus和unnux平台,公网局域网都能用,看你的这个应用习惯,其实三种文件服务器都不复杂,只是它应用的这个领域不太一样,它的优缺点不太一样,所以呢,我们说优点B,对它的优点是相对来说简单啊,不是构建这个成本比较低,对吧,这个时候呢,你只要干嘛,这个是买一台电脑,甚至都不用服服务器普通电脑。
04:59
就行,然后共享出来,大家访问就可以了,放到这台这台电脑放那就别别别碰就行,对吧,然后呢,可以在不同的主机诶,通过网络嘛,不同的操作系统之间来共享,那我们说啊各位,其实我们原先一直说,我说我们公司之间最基本的这种办公的这个设备就应该是一个什么,除了打印机就应该是文件服务器,对吧?但是近些年啊,一些小公司可能不一定用了,因为什么我们现在一些办公的集成工具,比如说钉钉啊,比如说邮件啊,可能一些啊,一些基本的共享,它能实现了,它所以不一定来搭了,因为这个东西虽然简单,但是他还是需要台电脑,还是需要干嘛有专业人员来配的,对,但是你想清楚啊,钉钉钉盘那些东西,他归根结底都是云存储,你的数据都是在对方的服务器上,对吧,安全对这个事情上你就说你你就要想啊,在当然绝大多数情况下没问题,这个人家不会偷你点这个东西,但是。
05:59
你自个儿想想,你总觉得你的东西,就比如说你有钱对吧,放在你家里,你觉得不不放心,我这里有个金库,你放我这儿吧,你要是银行可能国家来做储备可能还行,我说那王洋你看超哥这有个金库,你把钱给我吧,我可不是对,总觉得是心里比较别扭,对吧?对,所以我就说还是建议你们自己来搭建这种这个网络存储设设备还是建议的啊,那么缺点呢,就是。
06:28
要占用你的带宽,要占用你的局域网的这个,这个你办公网络的这个环境,然后呢,再一个受你的本地的交换机的性能影响,网线的影响,对吧,办公网络不一定都是六类或者七类响了肯定不是了,光纤也不要想了,光纤那玩意儿容易断,那办公环境下用光线不太可能对呀,所以可能就是标准的五雷线,那这时候就是百兆这个这个百兆百兆DPS啊,它的标准的这个传输速度了,可是啊,所以速度相对较慢,这是它的缺点,嗯,好,这是第二种啊,文件存储或者叫网络存储,好,那咱们继续往后看,下一个呢,是我们所谓的对象存储,当然还有别名叫分布式存储,听名字是不是就听出来了,我们大概应该有接触过,听过,诶,分布式计算,包括我们国家的曙光啊,它是不是都属于分布式计算的一种,嗯,好,那这里是分布式存储,你可以理解为我现在有三个鸡蛋,我拿三个篮子,一个篮存一个鸡蛋,那这样的话可能。
07:28
我的整个的存储量就会最多,而且呢可能安全性也更高,不要把鸡蛋放同一个篮子里面,就是备份的核心人啊好还有呢,就是我们的所谓的存储桶,当然这个概念是我呃在我们的腾讯云上见到的,嗯,当然这个也是一个不太多的这么一个概念,也可以理解为是对象存储的一种对好,那也就意味着他们都是彼此之间的别名,需要大家注意一下,讲的都同一个东西,对,那接下来呢,我们去看对象存储最重要的一点在样我们刚才所谓的文件存储里,我们知道一个文件存储数据的话,会分为两部分,第一个叫超级快,第二叫我们的数据块,超级块我们直接用S表题吧,那数据块比如我们直接用我们的BB去表示,那S块里存的都是我们的数据,比如的文件名啊,文件大小啊,输字输入啊,修改时间啊等等一系列的相关的原数据信息,我们叫对吧,好,那下一。
08:28
这个呢,才是存的我们这个文件真实的文件内容,嗯,那在我们FTP和NFS里,你可以把它理解为,诶,我是放在同一台服务器存储的,就在一块硬盘上,对,没错,那就意味着如果有一天我要去访问它的话,其实我访问的都是同一台服务器,哎,而且分不开。那如果我现在想实现,我想把这个block。给扩展为多个S,我不想动,因为它的数据是不是量还是比较小的,那也就意味着我先找S,我再去找block,能不能分开这样去读取呢?其实文件存储是做不到啊,这个地方就是说你要理解啊,不是说我们分区上部分分区上其实block是分开的,但是就是说你想在另外一块硬盘上把它数据做进去台机器,哎,这个可能就做不到了啊,做不到,当然block实际上是可以分开的啊,那当然我这里只是用B代替对吧,它代表的就是一大块硬盘,对就是,那当然也就意味着我在这种去水平扩展的话,那就比较难了,那也就意味着这也是我们对象存储出来的原因所在,我们可以把数据的原数据信息单独拿到一台机器。
09:38
嗯。我们可以把数据的元素信息单独拿到一台机器,比如这就是一台独立的服务器,可以去存储原数据,对,然后呢,后面我们把真实数据呢,分到不同的其他的服务器上,插电脑上,那这样的话,其实我们就做了一个分类了,那每次访问可能是怎样的流程呢?给大家简述一下,当用户提交访问,比如叫民歌点T,对吧,我们去访问到原数据信息,他会告诉我说,诶,你去找一个叫幺幺的机器,在第264个分区中,嗯,或者264个快手存储块,对,然后呢,我再去向比如这个幺幺的服务器去访问到这个真实的数据,我就可以得到,嗯,当然在此同时超哥可能过来,诶读了一个今天工资多少钱啊对吧?那元素一机会返回一个位置,他可能也会同时去读取另一台机器所在的一个增值服务,对,也就一。
10:40
定位的,其实我和超哥同时的理解为对在同时进行读取数据,那如果用我们传统的那种文这个网络文件服务啊,虽然也可以存同时读,但是他那块硬盘的速度就这么多流量被分开,包括磁盘就相当于就是说我说假设200兆,那一人100兆,那这个可就是一人200兆,对吧?哎,更便于我们的后期扩展,诶包括速率都会提升,这就是我们对象存储真正的设计核心所在,把元素信息和真实数据区分开来,需要注意好,那优点就是读取效率高,没错,那刚才我们也看到了,每个人可能会去占用单独的服务器的相关的一些性能,嗯,那对于我们刚才的文件存储来说呢,他可能是需要去评分到不同用户的,对需要注意好,那还有就是可以在不同主机之间共享存储,诶它还是网络,对啊,还是直接访问它的这个原数据服务器,它来给你分配。
11:40
就缓乱就行了,也就意味着它的门店系统依然是交给我们的存储服务本身解决,对对,不像我们之前刚才所说的,呃,快共享对吧,需要自己解决,这都是它的优点,当然我们还可以说一些别的一些子优点,比如什么更利于我们扩展啊,扩容啊,更利于我们的高可用的实现啊,啊比如说有一块数据坏了,假设对,我们可以假设一下,比如这块盘啊,存了一个一文件,嗯,那就像超我刚才说的,我们把这块盘啪坏了,嗯,那怎么办呢?文件是不是就丢了,那我可以设置这个文件有个副本数,比如副本数为二,那它会自动同步到这台服务器,有一天这块服务器死了,哎,那就得坏之前先重步过去啊,不是说坏已经坏了再同步,那那就不不行,那肯定不行,坏之前他先在旁边那个备份一次副本,他自己备份的啊,对,我们只需要设置副本数目即可,好,那这样自己备份过去以后,有一天他死了,那这台服务器可以继续访问,对对,然后他可以再在另外一台服务器。
12:40
再复制一个副本出来,对,他就会这样保证我们的副本数为可用,诶高可用数据坏了之后,这是最基本的要求,对吧,单台硬盘损坏不至于导致数据丢失,对,对吧?那当然其实它比我们的文件存储更好的地方在哪里,这个机器当了都没有问题,像我们刚才的文件存储可能只能单个磁盘损坏,没有问题,对吧?好,那优点就是我们刚才所说的给大家补充的这么几个,那缺点呢,缺点区就是造假昂贵啊,大家可以看到,包括我们刚才所说的文件存储,它可能只需要一台服务器,对,在这里。
13:15
我是画了这么几个啊,那当然在生这生态环境中可能是有十几个,可能有20几,可能有30几个都不等,也就意味着这里的造价是比较昂贵的,但还是那句话,企业的命脉就是自己掌握的数据,数据没了一切都白搭,如果你要用这种存储,就不怕把数据库误删了啊,你把数据库等于再来一份对不对?那缺点之二呢,就是技术实现难度较高,我们也可以看到对吧?像刚才的文件存储,我们只需要构建一个桑巴即可啊,这里可做到了我们的数据分散以及数据协同,所以是比较难实现的,对对,那这个呢,就是我们的对象存储或分布存储等等的,这么这个东西我优缺点我们就可以把它叫成数这个存储集群了,这就是我们的集群课里可能重点要学的几个技术这之一啊对啊,好了,那各位今天呢,我们这节课呢,主要看了一下,我们按照我们的这种存储的技术来分类了,这样的方法主要是三种,快速存储和。
14:15
这个网络存储包括这个对象存储这样三种,那么我们各自讲解了一下优缺点,那好,这节课的内容就到这里,我们下节课再见,再见。
我来说两句