00:00
嗯,大家晚上好。今天我看了这个中国数据库前世今生这部纪录片,然后看了第二集,也就是90年代的发展。然后下一级的话就应该是呃,00年那样。然后这部纪录片我觉得讲的挺好的,大家可以去呃,腾讯云开发者视频号里面可以看到这部纪录片,大家应该在腾讯云开发的社区里面也发布了这部。纪录片,然后他应该是讲述了中国数据库从1980~2020年期间的。一个。发展吧,然后。对一些鲜为人知的故事啊,然后做了一些讲述。啊,那进入我们今天的正题啊,下一集的话应该是00年代的所有。到00年代的话,应该比较流行的一个数据库,应该是就是说嗯,一个划时代的一个数据库,它出现了,它就是绿是我今天是跟大家。
01:09
聊的就是的出现好吧。嗯。主要是讲一下他的背景啊,起源这些的好吧。首先,我们先从一个数据库的发展史了解。首先是单数据库时代。然后这个时代的话,就是一个数据库就可以了。然后因为当时的话还没有进入大数据时代,然后的企业的一些数据量还是比较小的,然后业务还是比较简单的,只是单纯的一些,呃,增生改查,然后。嗯,也数据量不是那么大,然后一个数据库是完全能够支撑的。就拿一个学校的,呃,一个数据来讲吧。其实也不是很大。
02:00
然后一个数据库是完全能够解决的。后面进入了一个呃时代啊,然后随着这个系统的访问越来越大,用户的访问量越来越大,然后当单个数据库呢,它已经不能够。呃,满足了。然后这个时候我们引入了一些缓存啊,也是这个时候就有利历史了。就是。呃,加快它的读取嘛,因为数据量大的话,查的话在磁盘里面查,其实是响应的话是比较慢。然后我们就引入了历史时间缓存,然后到后面数据量太大太大了。然后一个数据库实力是不能够支撑的。然后我们就又提出了一个读写分离。然后就从读和写这个方面来缓解这个数据库的压力,你读是在一个数据库的实例上面,写的话又是在另外一个数据库的实例上面,然后就通过这种拆分,然后。
03:05
就缓解了一下这个压力嘛,然后到后面的话。呃,然后还是不能,然后主据库数主数据库的这个血库的这个压力啊,还是太大了,然后造成的瓶颈,后面我们就引起了一个。呃,集群和本扣分表。然后到。这个互联网大数据时代的到来的话,我们引进每个人都是可信逆风。然后他就结合这些人。主从集群啊,读写本离分库本表,然后构建了一个更为复杂,很强大的一些。呃,存储方案。嗯。这里应该。只是一个缓存技术,应该还没有出现绿历史。好吧。
04:01
然后我们讲一下绿女士的出现背景吧。在介绍这个出现的这个背景之下。我们先来了解一下这个磁盘存储的原理,大家都知道磁盘是由很多这个磁道组成的,然后每个磁道又被划分成了多个扇区,然后每个扇区又。划分了,呃,一个一个的,然后一个上级通过人是512支点嘛,这些都是呃。磁盘呢?存储的一些基本单元。然后行驶速度就是你要查数据对吧,你得转到那个磁盘对应的位置上才能查,所以有一个行驶速度啊。虽然是用毫秒为他们后面还有一个带宽,就是你读你找到了,然后你要读入内存啊,也是要有一些。呃,速度也衡量呢,然后是带宽这个东西嘛。
05:00
然后的话是以GB每秒来衡量的,后面我们再讲一下内存存储的原理吧。然后首先是这个。行驶速度,因为它行驶是非踌快的,而且纳米级别的带宽的话。呃,内存带宽是比磁盘要大得多了。然后内存的这个读写数据的话,是远远远超于这个磁盘的。嗯,还有一个IL成本问题,然后当这个数据非常大的时候,如果我们要从磁盘里面读取的话,它会非常慢的,尤其是这个随序读显。后面大家想到如果想用索引的话,但是数据量太大了,如果要管理这些索引的话,也是要占用大量的内存的。然后。也是非常麻烦的。而且的话,操作系统它这个读取的最小单单位,也就是以快为存储的。
06:03
也就意味着。如果我们。如果只需要一个字节的数据,我们也要去读。这个快。这是一个很大很大的一个问题啊。所以有的时候就是。此盘作为存储接近。然后I凹平静的话成为它最大问题,当文件越来越多时,然后磁盘的行驶和带宽是远低于内存的。然后磁盘比内存的寻址慢了差不多10万倍,然后这是一个非常致命的问题。嗯,好,我们来讲一下这个律师他是怎么诞生的啊。在08年的时候,塞维尔多他开发了一个网站,然后。要进行这个实时统计软件的一个项目嘛,也是这个项目实时记忆时的一个项目。需要频繁的进行数据库的一些读写。
07:00
可能1000秒每次哦。在这里之前,我先给给大家介绍一下这个网站吧,这个网站应该是提供一个类似访客的功能嘛。然后的话,他可以最多可以看到呃1万条记录,然后的话他需要为一个网站创建一个列表。不同网站记录到不同列表中,如果超过这个长度指定的长度,然后就要把它扔出去。大概就是这个图。然后。因为这个读写啊,它的那个输入太。读取的频率太太太大了,读水频率太频繁了,然后的话,他买四口的话,它是不是能够满足这个需求呢?然后这个大牛呢,也就是沙尔文诺,他就用C语言写的一个存储系统,也就是早期的一个绿历史嘛。然后他考虑到了一些数据库的性能,它主要是在这个磁盘上面。
08:03
然后才实现了这个呃,具有列表结构的数据库。它把数据不是放在。磁盘里面,而是放在一个内存里面。然后大大提高这个内。这个列表的push和po这里也是。进队和出队的一个,呃。效率嘛。就这个。然后他发现这个确实能够解决问题,然后他用新语言重启了这个内存数据库,然后加上持久化的功能,然后到09年的时候,立即是横空出世。然后后面就慢慢的被全世界广泛使用,然后成为一个。呃,开源项目。好,我们介绍完了。然后我们来讲一下这个利历史的主要发展史。主要就是从1~7吧。好吧,从1~7。
09:00
然后到他第一个版本的时候,第一个版本也是在09年发布的,然后他现主要是提供了一个TP限制度的一个存储,就是呃。下一个T,然后加一个K。礼物AK啊这些,删除AP啊这些。然后到2.0的时候,它就引入了一个新的一个数据类型。然后哈希亚集合这些。而且他这里啊,还引入了一个鲁尔脚本,撸尔脚本的话。大家应该也很熟悉吧,如果脚本的话,嗯,可能写一些。背部式锁的时候,大家肯定会写过一些简单的录文小本。它主要就是用来。嗯。一次完成一系列指定的一个类似的一个东西。然后到呃,3.0的时候。
10:03
然后他就加入了持久化班,是嘛的,一个新的持久化本身也是RDBO。IDB的话,它就是一个快照嘛。就是全部记录下来,Off的话就是操记录操作日志,然后还增加一些发布订阅的功能和一些缓存机制,然到4.0的时候,它就引进了这些集群,然后呃连实现了数据库的分布式的一些存储和读取。然后到5.0的时候,也是18年的时候,然后就引入了字符串的修改啊,和一些有序集合和地理空间索引啊。到6.0的时候,这个版本应该是用的还是比较多的。因为它是最企业化的一个版本。它了一些很多的模块,然后多线程IO能力。
11:01
大大加快了这个绿地是那个存储的速度啊。而到7.0的时候,也就是二二年的时候。然后他就发布了这个版本。然后它有一些核心的一些特性和改进啊,这些的话我就不详细展开,大家如果感兴趣的话,可以到它那个官网上去看啊,可以去看一些博客也可以,大家可以看到从2.0~7.0利率时的代码函数是一直在增加的。你说他的。内容是越来越多了。总的来说,利率是。它是一个非常好的一个肉色科水库啊。嗯嗯,我今天就讲这么多,谢谢大家。
我来说两句