关键系统的混沌工程实验思路?

对分布式系统,使用混沌工程实验,来提高验证系统架构的可靠性,其中故障注入方式主要包括硬件故障场景、基础应用软件故障场景、依赖故障场景等,验证系统服务是否健壮,有足够的弹性,可以容忍计划外的故障,测试过程中重点关注分布式系统脏读是否会导致资损风险,失败重试机制(上行或下行输入的大幅波动是否存在重试风暴),是否存在拜占庭故障(是否满足幂等性,多线程处理安全性)、异步事件响应中断后对系统影响(是否存在资损风险),故障转移隔离时发生的主从切换的脏读问题影响面。系统压力过载时对非核心交易进行熔断降级是否会导致核心交易产生级联失败(服务拆分不合理)问题。分布式节点宕掉后其前端RPC调用交易重试是否满足幂等性、负载均衡算法使用是否合理,超时重试机制有效性,超时设置是否满足漏斗原则,集群体系脑裂的规避方式有效性、分布式事务交易一致性等。这些感觉远远不够提出来;希望各位前辈能多提提意见。

参与1

0同行回答

“答”则兼济天下,请您为题主分忧!

提问者

guoxilin
高级非功能测试专家某科技公司
擅长领域: 服务器数据库云计算

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2020-09-17
  • 关注会员:1 人
  • 问题浏览:784
  • X社区推广