00:00
好了同学们,那咱们再往下给他讲什么呀,讲一下这个Maxwell跟这个canel尔一个对比啊,相信我同学之前也应该也用过这个canel啊,它是一家这个阿里,阿里开发的一个组件是吧,也是用来这个实时的抓取咱们这个MYSQL的数据的,并且它的原理跟咱们这个MYL一样,它也是通过监控这个MYSQL的是吧,他也会把咱们自己把这个卡EL尔也会把自己当成什么呀,当做一个MYSQL的冲击去实时的这个抓取咱们这个mys blog来做这么一个数据的同步啊,那咱们这两个文呃框架有什么区别啊,首先我们通过这么一个表格来讲一下啊,咱们通过这个开发语言来讲,无论是卡尔还是这个mawell都是通过Java写的,这个没有什么区别啊,另外咱们通过这个梳理格式啊,梳理格式就是咱们这个canel。它这个格式比较自由,它支持你自定义咱们这个卡EL是吧,因为它的安装,它安装起来,它它它这个又分为客户端跟这个服务端,就咱们如果想用这个行,你得用,你得安装一个服务端,你得安装个客户端,然后在这个客户端这一块,你可以自定义它那个数入格式,所以说咱们这个数据格式是比较自由的,而咱们这个macel呢,是人家这个原码里边写死的,咱们这个mace只能把咱们这个myce的数据给你同步成什么呀,同步成Jason格式。
01:15
啊,所以说通过这个数据格式,咱们这个Maxwell它用起来比较简单,就是JA森,大家会发现啊,大家问为什么呀,咱们这个Jason格式目前是比较流行的一种格式,我们在公司里边很多时候都更喜欢用这个Jason,也就是说哪怕你们公司用canel,你们最后自定义也会把这个格式自定义Jason,那因此你看这个时候是吧,就不如我的mal了,因为它简单啊,因为咱们这个mal使用起来比这个卡TEL要简单,安装起来也比较简单。因为咱们这个卡EL尔再安装起来,你还得安装一个服务端,还安装个客户端,而咱们这个mace没有,它就是就这么一个一一个进程就可以了,就它是一个守护进程,Java进程,OK啊,那咱们这个采集数据模式呢,注意这个时候咱们的这个ma就比这个卡EL要这个功能强大了,咱们这个卡EL它只支持这个数据的一个增量同步,就比如说咱们在咱们这个MY买MYSQL里边,我原本有一张表,就比如说我这个表叫AA。
02:08
那我这个如果用canel来做这个数据的同步,是是做这个数数据的抓取,那我只能抓到你这个A这张表呢,在今天正在新增的和这个变化的,就比如说我A,就是我在这个装卡之前,我这个AA这张表我已经有了100条了。那你又装,你在这个100条基础之上,你又装了个卡EL尔,那对不起,我这个卡尔没办法把这100条给同步到这个就抓抓取过来,我只能抓你的这个基于你的100条新增的,就比如说我今天新增了十条,而我这100条又变化了五条,那我只是会八把这15条我给它抓过来啊,抓回来是这样的啊,而咱们这个macel呢,Macel有一个数据的初始化的功能,我不仅支持增量更新,我还支持这个全量同步,就比如说在我装macel的时候呢,我这个,呃,我会把AA这张表我整个给再给,再可以再给你同步一下,就哪怕我这100条当初已经同步过了,我现在又想全量同步一下我AA这张表,那我这个mawelll也是支持的,在我下边这个案例里边,我给大家演示一下如何用这个mawell做这个数据的一个全量同步,好吧,所以说咱咱们这个数据的一个采集模式,咱们这个mawell是要比这个can要好一些的啊,那最后呢,这个数据的落地呢,数据的落地,咱们这个卡尔虽然也支持这个定制,但是它这个定制就比较麻烦了。
03:22
需要你自己写代码啊,去做这个数据的这个定制,而咱们这个mal呢,就人家本身它天生就支持多种平台,就比如说我支持卡夫卡,我支持KS,我支持red。而我知道不同的平台,我只需要改一个参数,就那个producer就能够保证咱们这个Maxwell能够把这个数据传给这个不同的平台,因此啊,咱们这个ma ma在使用起来要比这个卡na要方便的多啊,最后就是这个ha啊,这个ha这两个没有什么区别,它俩都支持的,只不过是吧,设置起来都相当麻烦啊,这个大家知道就好了,那因此啊,咱们这个表格就是简单给再给大家对比一下这个mace还这个糖。
04:00
啊,其实咱们这种工具有很多啊,包括在公司里边,现在这个flink也是也也是越来越火,很多公司里边,很多公司的这个实施项目都是拿那个flink的CDC啊flink CDC这么一个组件,我们写代码,我们也可以实现这么一个对my circle的这个数据,咱们做一个实时抓取,这个也可以啊,只不过咱们在咱们今天给他重点讲一下mal,大家知道就好了啊,那对于这个canel跟这个macel,我更建议大家选择mal,因为它使用起来很方便,很简单。好吧,那咱们这个对比就简单给讲到这儿啊。
我来说两句