温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
好,那首先呢,我们先看一下第一章叫canal的入门,刚才也说了,这一章呢,主要讲的是,呃,关于canal到底是什么东西,以及它实现的一个原理和它的一个工作场景啊,呃,那么首先呢,第一节讲的是什么是canal。呃,它主要起源于这个阿里啊,早期呢,我们知道像阿里里边呢,它有这个To B的业务,也就是对公的啊,还有一些TOC的,我们可能平时接触到的更多的TOC的,比方说淘宝,呃,类似于这样的啊,是直接面向用户的,但是To B的业务呢,可能他的卖家主要在国内,而买家在国外,那就势必他要在国外搭建他自己的一个机房,因为这样的话交互速度会更快一点,但同时我们又不希望呢,将数据全部都存在这个国外,所以他就衍生出了一个需求,就是说,呃,需要同步杭州和美国异地机房,将两个数据库呢,数据要进行一个同步啊。呃,那么从一零年开始的时候呢,阿里就开始尝试解析这个数据库的一个日志。
01:10
啊,通过读取日志的方式来加载这个数据,因为如果我们直接去读取异地机房的数据,那势必会增加。另外一个机房里边的压力,大家想一下是不是啊,所以呢,他就通过去解析我们。数据库当中的日志来完成增量数据的同步啊,那比方说查询这个就不需要了啊,所以呢,他就衍生出了增量订阅和消费的一个业务啊,就是从一零年开始左右,他就逐步的去研发这个项目,那后来呢,他们就研发出来一个东西叫auto。这个东西啊,这是一个大的一个框架,它呢是就是刚才我们所说的实现这个需求的,也就是说读取A机房的数据,然后通过中间的管道传输,接下来呢,同步到我们本地的机房,B机房,OK,呃,那这个里边呢,明显呢,第一要读取中间有管道,第三。
02:10
啊,那他需要写到B库里边儿啊,所以我们canal呢,在其中就充当了第一个环节的作用来。采集增量的日志啊,所以呢,呃,我们现在并不需要同步两个机房的数据,那我们现在是要监控某一个数据库当中变化的数据,那我们解析过来直接去用就好了,所以我们用不到al这个框架,我们只需要用到canal就行了,那么总而言之呢,Canal它主要就是解析。MYS的日志完成监控MYS当中动态变化的数据,包括新增、更改和删除都是可以拿得到的。OK,这是我们所讲的canal,它的一个概念以及它主要的作用。
我来说两句