事件起因:
由于不是客户的核心应用,是备份系统,当管理系统发现此存储丢失了才知道存储不能访问;
当工程师到达现场之后,发现存储电池坏了3个,电源坏了一个,磁盘坏了19块,最后造成数据丢失,raid组重新划分。
工程师更换了所有备件之后问题解决,此设备没有安排专人维护是造成宕机直接原因,而且还对相关的责任人取消年终奖励,对底层技术人员罚扣工资一个月。
来自社区交流活动“起底宕机事故-深度剖析宕机真相”
由社区会员“shizhe1030”发布
如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!
赞2
添加新评论0 条评论