kafka作为高频访问的消息中间件,叠加容器化的交付方式,使用持久化存储的性能关注点有哪些。是否普通的分布式存储就可以满足需求?还是要考虑使用高IO性能?
Kafka性能的主要指标是吞吐量(带宽)和时延。分布式存储是否满足需求,首先需要评估性能需求,根据Kafka消息的IO大小、存储的软硬件配置、批量参数、网络配置等综合评估可达到的吞吐量和时延情况。Kafka最核心的问题是数据访问的低时延,普通的分布式存储,由于三副本或者EC机制,需要跨网络在多节点之间做数据转发,一般全闪存配置的时延也在3ms左右,HDD配置下,更是在5~10ms范围,客观讲是不适合低时延业务负载诉求的。建议采用企业NAS存储,保障1ms的IO读写时延,同时最为适配容器场景,可租户级管理,可空间管理,可快速漂移,可资源共享。
收起在银行行业中,使用Kafka作为高频访问的消息中间件,叠加容器化的交付方式,使用持久化存储,需要考虑以下性能关注点:
普通的分布式存储可以满足Kafka的需求,但是在高并发、高吞吐量的情况下,需要考虑使用高IO性能的存储设备,以提高磁盘读写的效率,从而提高系统的性能和稳定性。同时,还需要考虑网络带宽、CPU和内存资源等因素,以保证系统的稳定性和可靠性。