Canal——原理架构及应用场景

Canal简介

Canal是阿里开源的一款基于Mysql数据库binlog的增量订阅和消费组件，通过它可以订阅数据库的binlog日志，然后进行一些数据消费，如数据镜像、数据异构、数据索引、缓存更新等。相对于消息队列，通过这种机制可以实现数据的有序化和一致性。

github地址：https://github.com/alibaba/canal

完整wiki地址：https://github.com/alibaba/canal/wiki

Canal工作原理

原理相对比较简单：

Canal——原理架构及应用场景

canal模拟mysql slave与mysql master的交互协议，伪装自己是一个mysql slave，向mysql master发送dump协议
mysql master收到mysql slave（canal）发送的dump请求，开始推送binlog增量日志给slave(也就是canal)
mysql slave（canal伪装的）收到binlog增量日志后,就可以对这部分日志进行解析，获取主库的结构及数据变更

Mysql主从同步原理

canal工作原理其实也是基于mysql主从同步原理的，所以理解mysql主从同步原理是第一步

Canal——原理架构及应用场景

master将改变记录到二进制日志(binary log)中
slave（I/O thread）将master的记录改变的binlog日志拷贝到它的中继日志(relay log)中
slave（SQL thread）重做中继日志中的事件，将改变反映它自己的数据从库中

Canal架构

Canal——原理架构及应用场景

说明：
server代表一个canal运行实例，对应于一个jvm
instance对应于一个数据队列

instance模块：
eventParser (数据源接入，模拟slave协议和master进行交互，协议解析)
eventSink (Parser和Store链接器，进行数据过滤，加工，分发的工作)
eventStore (数据存储)
metaManager (增量订阅&消费信息管理器)

Canal应用场景

1、同步缓存redis/全文搜索ES

　　canal一个常见应用场景是同步缓存/全文搜索，当数据库变更后通过binlog进行缓存/ES的增量更新。当缓存/ES更新出现问题时，应该回退binlog到过去某个位置进行重新同步，并提供全量刷新缓存/ES的方法，如下图所示。

Canal——原理架构及应用场景

　　2、下发任务

　　另一种常见应用场景是下发任务，当数据变更时需要通知其他依赖系统。其原理是任务系统监听数据库变更，然后将变更的数据写入MQ/kafka进行任务下发，比如商品数据变更后需要通知商品详情页、列表页、搜索页等先关系统。这种方式可以保证数据下发的精确性，通过MQ发送消息通知变更缓存是无法做到这一点的，而且业务系统中不会散落着各种下发MQ的代码，从而实现了下发归集，如下图所示。

Canal——原理架构及应用场景

　　3、数据异构

在大型网站架构中，DB都会采用分库分表来解决容量和性能问题，但分库分表之后带来的新问题。比如不同维度的查询或者聚合查询，此时就会非常棘手。一般我们会通过数据异构机制来解决此问题。

所谓的数据异构，那就是将需要join查询的多表按照某一个维度又聚合在一个DB中。让你去查询。canal就是实现数据异构的手段之一。

Canal——原理架构及应用场景

参考：

https://www.cnblogs.com/huangxincheng/p/7456397.html

Canal——原理架构及应用场景

Canal简介

Canal工作原理

Mysql主从同步原理

Canal架构

Canal应用场景

quguang

相关推荐

Binlog还能这样用之Canal篇

Canal v1.1.4版本避坑指南

canal demo搭建全记录

利用Canal完成Mysql数据同步Redis

Cannal实现数据异构

Canal相关理解

利用Canal完成Mysql数据同步Redis

canal 1.0.25 快速启动配置

使用阿里巴巴 Canal 增量订阅&消费组件同步 MySQL 数据到 Redis

阿里巴巴 MySQL 数据库 binlog 的增量订阅&消费组件

MySQL增量订阅&消费组件Canal POC

开源数据同步神器——canal

由 Canal 组件分析集成中间件架构的一般过程

基于阿里巴巴开源的分布式数据同步系统安装配置文档otter

由 Canal 组件分析集成中间件架构的一般过程