前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >大数据Canal(一):Canal介绍

大数据Canal(一):Canal介绍

作者头像
Lansonli
修改2023-03-13 18:22:13
1K0
修改2023-03-13 18:22:13
举报
文章被收录于专栏:Lansonli技术博客Lansonli技术博客

Canal介绍

一、​​​​​​​​​​​​​​什么是Canal

Canal [kə'næl],译意为水道/管道/沟渠,主要用途是基于 MySQL 数据库增量日志解析,提供增量数据订阅和消费。

早期阿里巴巴因为杭州和美国双机房部署,存在跨机房同步的业务需求,实现方式主要是基于业务 trigger 获取增量变更。从 2010 年开始,业务逐步尝试数据库日志解析获取增量变更进行同步,由此衍生出了大量的数据库增量订阅和消费业务。

当前的 canal 支持源端 MySQL 版本包括 5.1.x , 5.5.x , 5.6.x , 5.7.x , 8.0.x。

Canal目前没有独立的官网,可以在GitHub上下载和查看Canal文档,地址如下:https://github.com/alibaba/canal/wiki

二、​​​​​​​​​​​​​​Canal工作原理

1、MySQL主备复制原理

1.1、MySQL master 将数据变更写入二进制日志(binary log, 其中记录叫做二进制日志事件binary log events,可以通过 show binlog events 进行查看)

1.2、MySQL slave 将 master 的 binary log events 拷贝到它的中继日志(relay log)

注意:中继日志是从服务器I/O线程将主服务器的二进制日志读取过来,记录到从服务器本地文件,然后从服务器SQL线程会读取relay-log日志的内容并应用到从服务器,从而使从服务器和主服务器的数据保持一致。

1.3、MySQL slave 重放 relay log 中事件,将数据变更反映它自己的数据

2、canal 工作原理

2.1、canal 模拟 MySQL slave 的交互协议,伪装自己为 MySQL slave ,向 MySQL master 发送dump 协议

2.2、MySQL master 收到 dump 请求,开始推送 binary log 给 slave (即 canal )

2.3、canal 解析 binary log 对象(原始为 byte 流)

注意:mysql-binlog是MySQL数据库的二进制日志,记录了所有的DDL和DML(除了数据查询语句)语句信息。一般来说开启二进制日志大概会有1%的性能损耗。

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2023-03-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Canal介绍
    • 一、​​​​​​​​​​​​​​什么是Canal
      • 二、​​​​​​​​​​​​​​Canal工作原理
        • 1、MySQL主备复制原理
        • 2、canal 工作原理
    相关产品与服务
    云数据库 SQL Server
    腾讯云数据库 SQL Server (TencentDB for SQL Server)是业界最常用的商用数据库之一,对基于 Windows 架构的应用程序具有完美的支持。TencentDB for SQL Server 拥有微软正版授权,可持续为用户提供最新的功能,避免未授权使用软件的风险。具有即开即用、稳定可靠、安全运行、弹性扩缩等特点。
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档