kafka容器化如何尽可能不影响业务进行数据均衡?

参与15

3同行回答

扩容后的数据均衡涉及到分区在Broker之间的重新分配,会导致业务短暂的不可用。根据我们的实际测试,从3个POD扩容到6个POD的情况下做再均衡,业务不可用时间约为40s。实际部署过程中,这个时间与您扩容的节点数和均衡的工作量有关,因此还是建议在非生产时间进行扩容。...显示全部

扩容后的数据均衡涉及到分区在Broker之间的重新分配,会导致业务短暂的不可用。根据我们的实际测试,从3个POD扩容到6个POD的情况下做再均衡,业务不可用时间约为40s。实际部署过程中,这个时间与您扩容的节点数和均衡的工作量有关,因此还是建议在非生产时间进行扩容。

收起
硬件生产 · 2023-05-15
浏览588
zftangzftang其它小白一枚
一可以在晚间业务低峰时操作,必要时还可以和业务沟通,临时缩短数据保存时间,加快迁移,减少带宽影响时间二直接用Kafka官方提供的分区重新分配工具生成分区重分配方案,直接执行分区重分配。 ...显示全部

一可以在晚间业务低峰时操作,必要时还可以和业务沟通,临时缩短数据保存时间,加快迁移,减少带宽影响时间
二直接用Kafka官方提供的分区重新分配工具生成分区重分配方案,直接执行分区重分配。

 

收起
互联网服务 · 2023-05-11
浏览592
罗文江罗文江课题专家组云计算架构师某银行
建议先分析产生数据均衡的原因:1)组成员发生变更,比如新 consumer 加入组,或己有 consumer 主动离开组,再或是己有 consumer 崩溃时则触发 数据平衡 rebalance 。在实际环境下,这是触发数据平衡的主要原因。2)组订阅 topic 数发生变更,比如使用基于正则表达式的订阅,当匹配正则表...显示全部

建议先分析产生数据均衡的原因:

1)组成员发生变更,比如新 consumer 加入组,或己有 consumer 主动离开组,再或是己有 consumer 崩溃时则触发 数据平衡 rebalance 。在实际环境下,这是触发数据平衡的主要原因。
2)组订阅 topic 数发生变更,比如使用基于正则表达式的订阅,当匹配正则表达式的新 topic 被创建时则会触发数据平衡rebalance。
3)组订阅 topic 的分区数发生变更,比如使用命令行脚本增加了订阅 topic 的分区数。

深入了解数据平台的运行机理,和调整相应的参数设置,以降低数据平衡的频度或减少数据平衡的误判,从而规避数据平衡。

另外,是降低数据平衡的影响。譬如在规划阶段,相比使用本地盘方式,采用计算存储分离的架构,则有效收敛数据均衡的时间。

收起
银行 · 2023-05-13
浏览584

ChatGPT 回答

在银行行业中,Kafka是一种常用的消息队列系统,用于处理大量的实时数据。将Kafka容器化可以提高系统的可伸缩性和可靠性,但容器化也可能会影响业务进行数据均衡。以下是一些建议,以尽可能减少对业务的影响:

  1. 使用持久化存储:将Kafka容器的数据存储在持久化存储中,而不是在容器中。这样可以避免数据丢失的风险,并且在容器重启后能够快速恢复数据。建议使用高可靠性的存储系统,如分布式文件系统或云存储。
  2. 使用多个Kafka Broker:将Kafka Broker容器化并部署在多个节点上,以提高系统的可靠性和可伸缩性。这样可以避免单点故障,并且能够更好地处理大量的实时数据。建议使用负载均衡器来分发请求,以确保每个Broker都能够平均地处理请求。
  3. 使用监控工具:使用监控工具来监控Kafka容器的运行状况和性能。这样可以及时发现问题并进行调整,以确保数据均衡和系统的稳定性。建议使用开源监控工具,如Prometheus和Grafana。
  4. 使用容器编排工具:使用容器编排工具,如Kubernetes或Docker Swarm,来管理Kafka容器的部署和扩展。这样可以更好地管理容器的生命周期,并且能够快速地进行扩容和缩容。建议使用自动化工具来自动化部署和管理Kafka容器。

综上所述,通过使用持久化存储、多个Kafka Broker、监控工具和容器编排工具,可以尽可能减少Kafka容器化对业务进行数据均衡的影响。

提问者

starsky
系统运维工程师中原银行
擅长领域: 云计算容器容器云

问题来自

相关资料

相关文章

问题状态

  • 发布时间:2023-05-11
  • 关注会员:4 人
  • 问题浏览:1476
  • 最近回答:2023-05-15
  • X社区推广