[718]canal的配置详解

2023-11-01

canal的配置加载方式

介绍配置之前,先了解下canal的配置加载方式:

image.png

canal配置方式有两种:

  • ManagerCanalInstanceGenerator: 基于manager管理的配置方式,目前alibaba内部配置使用这种方式。大家可以实现CanalConfigClient,连接各自的管理系统,即可完成接入。
  • SpringCanalInstanceGenerator:基于本地spring xml的配置方式,目前开源版本已经自带该功能所有代码,建议使用

properties配置文件

properties配置分为两部分:

canal.properties (系统根配置文件)
instance.properties (instance级别的配置文件,每个instance一份)

canal.properties介绍:

canal配置主要分为两部分定义:

  1. instance列表定义 (列出当前server上有多少个instance,每个instance的加载方式是spring/manager等)
参数名字 参数说明 默认值
canal.destinations 当前server上部署的instance列表
canal.conf.dir conf/目录所在的路径 …/conf
canal.auto.scan 开启instance自动扫描,如果配置为true,canal.conf.dir目录下的instance配置变化会自动触发:a. instance目录新增: 触发instance配置载入,lazy为true时则自动启动; b. instance目录删除:卸载对应instance配置,如已启动则进行关闭;c. instance.properties文件变化:reload instance配置,如已启动自动进行重启操作 true
canal.auto.scan.interval instance自动扫描的间隔时间,单位秒 5
canal.instance.global.mode 全局配置加载方式 spring
canal.instance.global.lazy 全局lazy模式 false
canal.instance.global.manager.address 全局的manager配置方式的链接信息
canal.instance.global.spring.xml 全局的spring配置方式的组件文件 classpath:spring/file-instance.xml (spring目录相对于canal.conf.dir)
canal.instance.example.mode;canal.instance.example.lazy;canal.instance.example.spring.xml;…… instance级别的配置定义,如有配置,会自动覆盖全局配置定义模式;命名规则:canal.instance.{name}.xxx
canal.instance.tsdb.spring.xml v1.0.25版本新增,全局的tsdb配置方式的组件文件 classpath:spring/tsdb/h2-tsdb.xml (spring目录相对于canal.conf.dir)
  1. common参数定义,比如可以将instance.properties的公用参数,抽取放置到这里,这样每个instance启动的时候就可以共享。【instance.properties配置定义优先级高于canal.properties】
参数名字 参数说明 默认值
canal.id 每个canal server实例的唯一标识,暂无实际意义 1
canal.ip canal server绑定的本地IP信息,如果不配置,默认选择一个本机IP进行启动服务
canal.port canal server提供socket服务的端口 11111
canal.zkServers canal server链接zookeeper集群的链接信息;例子:127.0.0.1:2181,127.0.0.1:2182
canal.zookeeper.flush.period canal持久化数据到zookeeper上的更新频率,单位毫秒 1000
canal.file.data.dir canal持久化数据到file上的目录 …/conf (默认和instance.properties为同一目录,方便运维和备份)
canal.file.flush.period canal持久化数据到file上的更新频率,单位毫秒 1000
canal.instance.memory.batch.mode canal内存store中数据缓存模式;1. ITEMSIZE : 根据buffer.size进行限制,只限制记录的数量;2. MEMSIZE : 根据buffer.size * buffer.memunit的大小,限制缓存记录的大小 MEMSIZE
canal.instance.memory.buffer.size canal内存store中可缓存buffer记录数,需要为2的指数 16384
canal.instance.memory.buffer.memunit 内存记录的单位大小,默认1KB,和buffer.size组合决定最终的内存使用大小 1024
canal.instance.transactionn.size 最大事务完整解析的长度支持超过该长度后,一个事务可能会被拆分成多次提交到canal store中,无法保证事务的完整可见性 1024
canal.instance.fallbackIntervalInSeconds canal发生mysql切换时,在新的mysql库上查找binlog时需要往前查找的时间,单位秒;说明:mysql主备库可能存在解析延迟或者时钟不统一,需要回退一段时间,保证数据不丢 60
canal.instance.detecting.enable 是否开启心跳检查 false
canal.instance.detecting.sql 心跳检查sql insert into retl.xdual values(1,now()) on duplicate key update x=now()
canal.instance.detecting.interval.time 心跳检查频率,单位秒 3
canal.instance.detecting.retry.threshold 心跳检查失败重试次数 3
canal.instance.detecting.heartbeatHaEnable 心跳检查失败后,是否开启自动mysql自动切换;说明:比如心跳检查失败超过阀值后,如果该配置为true,canal就会自动链到mysql备库获取binlog数据 false
canal.instance.network.receiveBufferSize 网络链接参数,SocketOptions.SO_RCVBUF 16384
canal.instance.network.sendBufferSize 网络链接参数,SocketOptions.SO_SNDBUF 16384
canal.instance.network.soTimeout 网络链接参数,SocketOptions.SO_TIMEOUT 30
canal.instance.filter.query.dcl 是否忽略DCL的query语句,比如grant/create user等 false
canal.instance.filter.query.dml 是否忽略DML的query语句,比如insert/update/delete table.(mysql5.6的ROW模式可以包含statement模式的query记录) false
canal.instance.filter.query.ddl 是否忽略DDL的query语句,比如create table/alater table/drop table/rename table/create index/drop index. (目前支持的ddl类型主要为table级别的操作,create databases/trigger/procedure暂时划分为dcl类型) false
canal.instance.filter.druid.ddl v1.0.25版本新增,是否启用druid的DDL parse的过滤,基于sql的完整parser可以解决之前基于正则匹配补全的问题,默认为true true
canal.instance.get.ddl.isolation ddl语句是否隔离发送,开启隔离可保证每次只返回发送一条ddl数据,不和其他dml语句混合返回.(otter ddl同步使用) false
instance.properties介绍:

a. 在canal.properties定义了canal.destinations后,需要在canal.conf.dir对应的目录下建立同名的文件

比如:

canal.destinations = example1,example2

这时需要创建example1和example2两个目录,每个目录里各自有一份instance.properties.

canal自带了一份instance.properties demo,可直接复制conf/example目录进行配置修改

b. 如果canal.properties未定义instance列表,但开启了canal.auto.scan时

server第一次启动时,会自动扫描conf目录下,将文件名做为instance name,启动对应的instance
server运行过程中,会根据canal.auto.scan.interval定义的频率,进行扫描

  1. 发现目录有新增,启动新的instance
  2. 发现目录有删除,关闭老的instance
  3. 发现对应目录的instance.properties有变化,重启instance

instance.properties参数列表:

参数名字 参数说明 默认值
canal.instance.mysql.slaveId mysql集群配置中的serverId概念,需要保证和当前mysql集群中id唯一 1234
canal.instance.master.address mysql主库链接地址 127.0.0.1:3306
canal.instance.master.journal.name mysql主库链接时起始的binlog文件
canal.instance.master.position mysql主库链接时起始的binlog偏移量
canal.instance.master.timestamp mysql主库链接时起始的binlog的时间戳
canal.instance.dbUsername mysql数据库帐号 canal
canal.instance.dbPassword mysql数据库密码 canal
canal.instance.defaultDatabaseName mysql链接时默认schema
canal.instance.connectionCharset mysql 数据解析编码 UTF-8
canal.instance.filter.regex mysql 数据解析关注的表,Perl正则表达式;多个正则之间以逗号(,)分隔,转义符需要双斜杠(\\) ;常见例子:1. 所有表:.* or .*\\..*;2. canal schema下所有表: canal\\..*;3. canal下的以canal打头的表:canal\\.canal.*;4. canal schema下的一张表:canal.test1;5. 多个规则组合使用:canal\\..*,mysql.test1,mysql.test2 (逗号分隔);注意:此过滤条件只针对row模式的数据有效(ps. mixed/statement因为不解析sql,所以无法准确提取tableName进行过滤) .*\\..*
canal.instance.tsdb.enable v1.0.25版本新增,是否开启table meta的时间序列版本记录功能 true
canal.instance.tsdb.dir v1.0.25版本新增,table meta的时间序列版本的本地存储路径,默认为instance目录 {canal.instance.destination:}
canal.instance.tsdb.url v1.0.25版本新增,table meta的时间序列版本存储的数据库链接串,比如例子为本地嵌入式数据库 jdbc:h2:${canal.instance.tsdb.dir}/h2;CACHE_SIZE=1000;MODE=MYSQL;
canal.instance.tsdb.dbUsername v1.0.25版本新增,table meta的时间序列版本存储的数据库链接账号 canal
canal.instance.tsdb.dbUsername v1.0.25版本新增,table meta的时间序列版本存储的数据库链接密码 canal

几点说明:

  1. mysql链接时的起始位置
  • canal.instance.master.journal.name + canal.instance.master.position : 精确指定一个binlog位点,进行启动
  • canal.instance.master.timestamp : 指定一个时间戳,canal会自动遍历mysql binlog,找到对应时间戳的binlog位点后,进行启动
  • 不指定任何信息:默认从当前数据库的位点,进行启动。(show master status)
  1. mysql解析关注表定义
  • 标准的Perl正则,注意转义时需要双斜杠:\\
  1. mysql链接的编码
  • 目前canal版本仅支持一个数据库只有一种编码,如果一个库存在多个编码,需要通过filter.regex配置,将其拆分为多个canal instance,为每个instance指定不同的编码

来源:https://blog.csdn.net/qq_26502245/article/details/90445323
https://blog.csdn.net/syslbjjly/article/details/88244040
https://www.cnblogs.com/eason-d/p/9300754.html

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

[718]canal的配置详解 的相关文章

  • C语言 _ 指针(超详解析 3分钟完全掌握 总结性讲解 经典通俗)

    目 录 1 指针 指针变量及指针的大小 2 指针类型 3 指针的解引用 4 指针运算 4 1指针 整数 4 2指针 指针 5 野指针 5 1 为什么会有野指针 5 2 如何规避野指针 6 指针和数组 7 二级指针 7 1二级指针的定义 8
  • Java中的加号“+”

    在Java中 加号 与数学上的加号有些不同 它有两个意思 一个是算术运算中的 一个是连接符的重要 类似于C语言中的strcat函数 怎么区分这两种作用呢 1 当 两边是非数值类型 就被看作连接符 2 当 两边都是数值类型 就被看作算术运算中
  • ZYNQ平台在SDK下引导启动UBOOT

    ZYNQ芯片 Linux系统搭建完成后 希望通过QSPI Flash的方式来进行程序加载 QSPI Flash启动则需要烧录以下文件 BOOT bin fsbl elf uboot elf uImage linux内核 zynq board
  • 小吴学前端--Element-UI tree 组件 选中节点高亮(持续高亮)

    最近开发的时候遇到的一个需求 1 加深选中单据颜色框 2 在不切换tree组件时 选中的一直保持高亮 由于对该组件不是很熟悉 记下笔记 用来巩固学习 1 点击后高亮显示的背景颜色修改 仅仅需要修改css部分即可 deep el tree n

随机推荐

  • 从语言到品牌

    在竞争激烈的商业环境中 一个强大的品牌所带来的广泛品牌影响力是企业成功的关键要素之一 无论是刚刚起步的初创公司 还是已经存在多年的大型企业 都需要创建最符合自身 最贴合市场受众的品牌名称 并且持续努力来塑造和维护自己的品牌 以吸引更多客户
  • WSDL文档结构详解(五)

    1 实例截图 2 wsdl文件分析
  • C++静态链接库

    1 打开VS2010 新建win32项目 命名libm 下一步选中静态库完成 2 新建空文件mylib h和mylib cpp 其中mylib h文件中代码如下 ifndef LIB H define LIB H extern C int
  • 9个爬虫基础实战汇总+4个专业爬虫练手站推荐

    个人主页 互联网阿星 格言 选择有时候会大于努力 但你不努力就没得选 作者简介 大家好我是互联网阿星 和我一起合理使用Python 努力做时间的主人 如果觉得博主的文章还不错的话 请点赞 收藏 留言 支持一下博主哦 行业资料 PPT模板 简
  • 嵌入式系统图解

    嵌入式系统组成 嵌入式系统硬件结构图 嵌入式软件运行流程 体系结构和接口 ARM Cotex M3内核架构图
  • 查看jvm运行情况

    使用 jps 或top显示当前所有java进程pid 详细的使用方法可参考博客 https blog csdn net u013250071 article details 80496623 https blog csdn net weix
  • Yolov4部署到ZYNQ系列4-网络地址调整和部署

    文章目录 前言 一 笔记本上的步骤 二 开发板上的步骤 三 部署 四 总结 前言 本文参照上一节的工作 使用Vitis AI 1 4与Vitis AI 2 5的工具得到的量化和编译 在开发板上部署 但在此之前 不想使用路由的方式 直接通过网
  • HIVE介绍(五)

    文章目录 HIVE介绍 hql语法 hive优缺点 Hive运行原理 Hive为什么要分区 partitioned by Hive与mysql的对比 Hive内部表和外部表 hive数据类型 hive数据存格式 自定义函数UDF和UDTF
  • 数字IC笔试面试常考问题及答案

    来源 知乎 链接 https zhuanlan zhihu com p 261298869 基础知识 原理务必理解透彻 锁存器的结构 DFF的结构 建立保持时间 亚稳态 STA CDC 亚稳态的成因 危害 解决方法 建立保持时间的计算 违例
  • centos 软件卸载

    1 查找系统注册名称 rpm q a grep 软件名 2 卸载 rpm e package name 即可卸载软件 参数e的作用是使rpm进入卸载模式 对名为 package name 的软件包进行卸载 由于系统中各个软件包之间相互有依赖
  • Linux 非阻塞connect

    套接字执行I O操作有阻塞和非阻塞两种模式 在阻塞模式下 在I O操作完成前 执行操作的函数一直等候而不会立即返回 该函数所在的线程会阻塞在这里 相反 在非阻塞模式下 套接字函数会立即返回 1 而不管I O是否完成 该函数所在的线程会继续运
  • https流程详解(含ca证书校验)

    首先来说 一下 为什么需要https 加密 由于http 传输是明文传输 信息在传输的过程中容易被篡改 不安全 所以 就有了 加密传输 对称加密 aes等 对称加密很容易理解 就是 只有一个秘钥 可以使用这个秘钥加密和解密 但是这样只要被别
  • 关系型数据库RDBMS -MySQL基础入门(五)数据备份与恢复

    一 物理备份 innodbackupex 二 逻辑备份 mysqldump Binlog 二进制 日志文件 备份恢复 主从同步 除查询sql所有命令都记录 索引文件 bin index bin 000001 Purge master log
  • 蓝牙之九-AT命令

    AT命令用于HF协议 该命令使参考3GPP 27 007协议 以下是HFP规范 每个命令行只有一个命令 AG侧默认不回显命令 AG使用冗长的格式返回结果 以下字符将被用于AT命令和返回结果格式中
  • Spring MVC详解

    第一节 Spring MVC 简介 1 Spring MVC SpringMVC是一个Java 开源框架 是Spring Framework生态中的一个独立模块 它基于 Spring 实现了Web MVC 数据 业务与展现 设计模式的请求驱
  • Session的生命周期

    以前在学习的时候没怎么注意 今天又回过头来仔细研究研究了一下Session的生命周期 Session存储在服务器端 一般为了防止在服务器的内存中 为了高速存取 Sessinon在用户访问第一次访问服务器时创建 需要注意只有访问JSP Ser
  • 什么是DDL和DML语句?

    1 什么是DDL和DML语句 SQL语言分成三大类 1 DDL语言 2 DML语言 3 DCL语言 可恶 竟然在技术内幕只提及了一部分 内幕661 要知道DDL是什么意思 必须先了解它的英文全称 data definition langua
  • 【华为OD机试】TLV解析Ⅰ【2023 B卷

    华为OD机试 真题 点这里 华为OD机试 真题考点分类 点这里 题目描述 TLV 编码是按 Tag Length Value 格式进行编码的 一段码流中的信元用Tag标识 Tag在码流中 唯一不重复 Length表示信元Value的长度 V
  • Linux 定时任务crontab配置

    https www cnblogs com zoulongbin p 6187238 html
  • [718]canal的配置详解

    文章目录 canal的配置加载方式 properties配置文件 canal properties介绍 instance properties介绍 canal的配置加载方式 介绍配置之前 先了解下canal的配置加载方式 canal配置方式