介绍

canal 是阿里巴巴的一个开源项目，基于java实现，整体已经在很多大型的互联网项目生产环境中使用，包括阿里、美团等都有广泛的应用，是一个非常成熟的数据库同步方案，基础的使用只需要进行简单的配置即可。

canal是通过模拟成为mysql 的slave的方式，监听mysql 的binlog日志来获取数据，binlog设置为row模式以后，不仅能获取到执行的每一个增删改的脚本，同时还能获取到修改前和修改后的数据，基于这个特性，canal就能高性能的获取到mysql数据数据的变更。

开源数据同步神器——canal

使用

canal的介绍在官网有非常详细的说明，如果想了解更多，大家可以移步官网（https://github.com/alibaba/canal）了解。我这里补充下使用中不太容易理解部分。

canal的部署主要分为server端和client端。

server端部署好以后，可以直接监听mysql binlog,因为server端是把自己模拟成了mysql slave，所以，只能接受数据，没有进行任何逻辑的处理，具体的逻辑处理，需要client端进行处理。

client端一般是需要大家进行简单的开发。https://github.com/alibaba/canal/wiki/ClientAPI 有一个简单的示例，很容易理解。

canal Adapter

为了便于大家的使用，官方做了一个独立的组件Adapter，Adapter是可以将canal server端获取的数据转换成几个常用的中间件数据源，现在支持kafka、rocketmq、hbase、elasticsearch，针对这几个中间件的支持，直接配置即可，无需开发。上文中，如果需要将mysql的数据同步到elasticsearch，直接运行 canal Adapter，修改相关的配置即可。

常见问题

无法接收到数据，程序也没有报错？
一定要确保mysql的binlog模式为row模式，canal原理是解析Binlog文件，并且直接中文件中获取数据的。
Adapter 使用无法同步数据？
按照官方文档，检查配置项，如sql的大小写，字段的大小写可能都会有影响，如果还无法搞定，可以自己获取代码调试下，Adapter的代码还是比较容易看懂的。

canal Adapter elasticsearch 改造

因为有了canal和canal Adapter这个神器，同步到elasticsearch、hbase等问题都解决了，但是自己的开发的过程中发现，Adapter使用还是有些问题，因为先使用的是elasticsearch同步功能，所以对elasticsearch进行了一些改造：

elasticsearch初始化

一个全新的elasticsearch无法使用，因为没有创建elasticsearch index和mapping,增加了对应的功能。

elasticsearch配置文件mapping节点增加两个参数：

enablefieldmap: true
 fieldmap:
 id: "text"
 name: "text"
 c_time: "text"

enablefieldmap 是否需要自动生成fieldmap，默认为false,如果需要启动的时候就生成这设置为true,并且设置

fieldmap,类似elasticsearch mapping中每个字段的类型。

esconfig bug处理

代码中获取binlog的日志处理时，必须要获取数据库名，但是当获取binlog为type query时，是无法获取

数据库名的，此处有bug，导致出现 "Outer adapter write failed" ,且未输出错误日志，修复此bug.

后续计划

增加rabbit MQ的支持
增加redis的支持

源码

源码地址：https://github.com/itmifen/canal

开源数据同步神器——canal

介绍

使用

常见问题

后续计划

源码

liangwenrong

相关推荐

Binlog还能这样用之Canal篇

Canal v1.1.4版本避坑指南

canal demo搭建全记录

Canal——原理架构及应用场景

利用Canal完成Mysql数据同步Redis

Cannal实现数据异构

Canal相关理解

利用Canal完成Mysql数据同步Redis

canal 1.0.25 快速启动配置

使用阿里巴巴 Canal 增量订阅&消费组件同步 MySQL 数据到 Redis

阿里巴巴 MySQL 数据库 binlog 的增量订阅&消费组件

MySQL增量订阅&消费组件Canal POC

由 Canal 组件分析集成中间件架构的一般过程

基于阿里巴巴开源的分布式数据同步系统安装配置文档otter

由 Canal 组件分析集成中间件架构的一般过程