搜索
搜 索
本版
文章
帖子
用户
图文精华
hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...
首页
Portal
专题
BBS
面试
办公|编程助手
更多
登录
注册
用户组:游客
主题
帖子
云币
我的帖子
我的收藏
我的好友
我的勋章
设置
退出
导读
淘贴
博客
群组
社区VIP
APP下载
今日排行
本周排行
本周热帖
本月排行
本月热帖
会员排行
About云-梭伦科技
»
专题
›
技术学习(版主发帖区)
›
大数据学习
›
总结型
›
Debezium使用经验总结
0
0
2
分享
Debezium使用经验总结
阿飞
2021-3-4 06:45:49
发表于
总结型
[显示全部楼层]
阅读模式
关闭右栏
0
2992
问题导读
1.kafka connect 的 rebalance可能会出哪些问题?
2.debezium connector 重启可能会有哪些问题?
3.为了解决debezium的问题,该如何避免?
对debezium的运维和使用大半年时间。曾经管理的单个debezium集群有 10 个左右的 debeizum 任务。某个库的debezium订阅的表数量大概有几十个,得出了很多经验,踩了很多坑。下面会列出各种遇到的问题和一些比较不错的实践。
踩坑
debezium坑很多!!最大的坑就是 kafka connect 的 rebalance;每当有新的debezium connector 被发到集群后,就会触发集群的 rebalance;
集群内部的 connector 任务开始重启,表面上看任务重新分配,每个debezium实例都能均匀的分配到任务,确实很优雅。但是事实上重启集群内部所有的 connector 一个很重的操作。由于本身 debezium 的一些不优雅的特性,导致重启有可能造成集群内多个 connector 挂掉。所以需要尽可能的少触发集群的 rebalance; 不过这个巨坑其实很难避免。
其它的几个大坑:
debezium 的 history topic 不能被多个 connector 共用。如果新的 connector 使用了集群内某个 connector 正在使用的 history topic,集群内的正在使用 history topic 的 connector 会抛出异常终止(这个在 0.5.x 版本的时候,并不会抛出异常!!)。
尽可能的每个库对应一个 connector,每个 connector 只订阅需要接入 debezium 的某个库内的表。可以通过设置库的白名单和表的白名单实现。(一个任务订阅多个库、多个表是非常不正确的行为,后续新增表代价会非常大)
debezium connector 重启并不是每次都成功的,也即是说 connector 重启可能会导致任务挂掉。history topic 可能会非常的大,connector 重启时会读取 history topic 所有数据,如果 history topic 数据量非常的大,connector 可能就无法在给定的时间内启动,connector 抛出异常启动失败。
坑 3 这个坑遇上 rebalance,就会出现比较严重的问题。如果集群内有多个 connector,并且多个 connector 的 histroy topic 都很大,那 rebalance 之后,这些 connector 很有可能都会重启失败。
坑 1 和 rebalance 也有关系。debezium 集群内 connector 数量很多时,重启可能会发生 history topic 被共用的异常,但是事实上我们并没有共用!
建议
一个 debezium 内尽量不要运行太多的 connector。相同数量的机器情况下,多集群的效果会比单集群多服务器好很多!
把很重的 connector 迁到单独的集群。比如我所在的公司,需要订阅一个库内几十个表,这就导致任务的重启非常的慢,停掉任务就要花很长时间,如果和其它 connector 部署在一起,不是很好!(理由自己想)
推荐将 debezium 部署到 k8s,集群扩容、缩容会很方便。
可以尝试将每个 connector 对应一个 k8s pod,来做到正真的资源隔离,互不影响。当然这个我没有尝试过 ~.~ 。
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
显身卡
没找到任何评论,期待你打破沉寂
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
发表新帖
阿飞
超级版主
关注
1893
主题
1998
帖子
123
粉丝
TA的主题
华为OD目标院校名单(2024.07新版)
2024-7-19
国/央企投递全流程经验分享
2024-7-15
2024年了,互联网大厂福利还香吗?
2024-5-23
华为3年涨薪6次,每次涨薪高达3万
2024-5-14
华为OD面试
2024-5-13
24小时热文
Docker+容器与容器云(第2版)
docker容器实战:原理、架构与应用
Docker基础与实战
kafka面试题精选
Nebula Flink Connector 在实时 ETL 的实践
关闭
推荐
/2
中文版ChatGPT
1.无需魔法 2.提高编程效率 3.提高文档能力
查看 »
新手帮助
新手帮助:注册遇到问题,领取资源,加入铁粉群,不会使用搜索,如何获取积分等
查看 »
意见
反馈