kafka选择的持久化存储性能关注点?

kafka作为高频访问的消息中间件,叠加容器化的交付方式,使用持久化存储的性能关注点有哪些。是否普通的分布式存储就可以满足需求?还是要考虑使用高IO性能?

参与10

3同行回答

zftangzftang其它小白一枚
对象的内存开销非常高,通常是要存储的数据的两倍甚至更高随着堆内数据的增加,GC的速度越来越慢显示全部
  • 对象的内存开销非常高,通常是要存储的数据的两倍甚至更高
  • 随着堆内数据的增加,GC的速度越来越慢
收起
互联网服务 · 2023-05-10
浏览532
Kafka性能的主要指标是吞吐量(带宽)和时延。分布式存储是否满足需求,首先需要评估性能需求,根据Kafka消息的IO大小、存储的软硬件配置、批量参数、网络配置等综合评估可达到的吞吐量和时延情况。Kafka最核心的问题是数据访问的低时延,普通的分布式存储,由于三副本或者EC机制,需...显示全部

Kafka性能的主要指标是吞吐量(带宽)和时延。分布式存储是否满足需求,首先需要评估性能需求,根据Kafka消息的IO大小、存储的软硬件配置、批量参数、网络配置等综合评估可达到的吞吐量和时延情况。Kafka最核心的问题是数据访问的低时延,普通的分布式存储,由于三副本或者EC机制,需要跨网络在多节点之间做数据转发,一般全闪存配置的时延也在3ms左右,HDD配置下,更是在5~10ms范围,客观讲是不适合低时延业务负载诉求的。建议采用企业NAS存储,保障1ms的IO读写时延,同时最为适配容器场景,可租户级管理,可空间管理,可快速漂移,可资源共享。

收起
硬件生产 · 2023-05-12
浏览517
waring_idwaring_id技术经理某公司
要同时考虑日志写入的频率和数量以及消费端的消费情况。条件允许建议配置高缓存型(例如内存和SSD缓存硬盘)+万兆网络的模式显示全部

要同时考虑日志写入的频率和数量以及消费端的消费情况。条件允许建议配置高缓存型(例如内存和SSD缓存硬盘)+万兆网络的模式

收起
零售/批发 · 2023-05-12
浏览498

ChatGPT 回答

在银行行业中,使用Kafka作为高频访问的消息中间件,叠加容器化的交付方式,使用持久化存储,需要考虑以下性能关注点:

  1. 磁盘IO性能:Kafka使用持久化存储,需要频繁地进行磁盘读写操作,因此需要考虑使用高IO性能的存储设备,如SSD硬盘。
  2. 网络带宽:Kafka作为消息中间件,需要频繁地进行消息传输,因此需要考虑网络带宽的问题,尤其是在高并发的情况下。
  3. CPU和内存资源:Kafka需要进行消息的序列化和反序列化操作,同时需要维护消息的索引和元数据等信息,因此需要考虑CPU和内存资源的使用情况。
  4. 分布式存储:Kafka是一种分布式的消息中间件,需要考虑分布式存储的问题,如数据的分片和复制等。

普通的分布式存储可以满足Kafka的需求,但是在高并发、高吞吐量的情况下,需要考虑使用高IO性能的存储设备,以提高磁盘读写的效率,从而提高系统的性能和稳定性。同时,还需要考虑网络带宽、CPU和内存资源等因素,以保证系统的稳定性和可靠性。

提问者

wwzwh9521
系统工程师bcs
擅长领域: 存储灾备云计算

问题来自

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2023-05-09
  • 关注会员:5 人
  • 问题浏览:1377
  • 最近回答:2023-05-12
  • X社区推广