互联网服务容灾

福岛核电站事故对信息系统容灾有什么启示?

反应堆停堆之后要确保关键的冷却系统能够继续供电,最后一道屏障,就是蓄电池组。这跟我们数据中心管理员最熟悉的UPS道理是一样的。

参与11

2同行回答

dulantedulante软件开发工程师北京酷吧科技有限公司
1. 大家应该明白,灾难最可怕的是它的连锁反应,这会导致灾难不断扩大和升级。容灾过程中所有决策的核心,不是去“希望”灾难不会升级;而恰恰相反,是去按照最坏的场景假设,以决策如何避免灾难升级。本来以最快速度不惜代价接入电力就可以确保事故不必发生;当冷却失败后不惜损毁反...显示全部

1. 大家应该明白,灾难最可怕的是它的连锁反应,这会导致灾难不断扩大和升级。容灾过程中所有决策的核心,不是去“希望”灾难不会升级;而恰恰相反,是去按照最坏的场景假设,以决策如何避免灾难升级。本来以最快速度不惜代价接入电力就可以确保事故不必发生;当冷却失败后不惜损毁反应堆就可以防止核污染;当核污染无法避免时及时通报尽全力疏散就可以避免更大的损失。但是当事人做出一系列错误的决策,恰恰是因为“希望”灾难不会扩大和升级。

2. 不要把所有希望都寄托在双活、多活的架构上。多活可以轻松面对一些灾难,但对另外一些灾难完全束手无策。数据中心的多活更是如此。

3. 预案要设想各种灾难的具体情况。福岛灾难最开始的原因是他们执行的预案是针对地震的而非海啸。

4. 预想灾难时要充分考虑本地的具体情况。福岛的海堤高度是依据1960年智利大地震的数据设计的。但日本地震调查研究促进会发现因为地质结构不同,福岛很有可能面临高得多的海啸,督促东电公司需加高防护海堤。但是东电以耗资巨大,并且理论中预测的海啸实际发生率太低为由,未采取任何行动。

5. 多种手段防止灾难。福岛在灾难设计上用了多道屏障保障电力供应。如果没有这些屏障连最初的八个小时都不会有。

6. 必须充分考虑兼容性问题。电力系统还会互不兼容的问题大概只有日本才会出现。但是这正好为我们IT容灾提了醒,因为IT系统上面临的兼容性问题远比电力系统更复杂。

7. 充分演练。如果核电站之前有过哪怕一次全面演练,就不会出现备用电力无人能够接入的尴尬。

8. 保证真实信息的准确流通。没有完整确切的信息就无法准确决策。试想如果日本政府了解到时间的紧迫性,调动所有资源和力量,在蓄电池耗尽前接入电力应该是可以做到的。

收起
软件开发 · 2017-03-27
浏览1974
qq373793057qq373793057课题专家组系统工程师某银行
的确,如果福岛核电站能够保障应急电力的供应,应该会将这场灾难带来的后果降低。下面从电力演练为切入点,谈谈福岛事故带给我们的启示:1、首先,从电力建设方面,对UPS主机、蓄电池的选型要严把质量关,杜绝生产工艺不统一、蓄电池一致性极差的产品。从环境和使用过程入手,提升UPS工...显示全部

的确,如果福岛核电站能够保障应急电力的供应,应该会将这场灾难带来的后果降低。下面从电力演练为切入点,谈谈福岛事故带给我们的启示:

1、首先,从电力建设方面,对UPS主机、蓄电池的选型要严把质量关,杜绝生产工艺不统一、蓄电池一致性极差的产品。从环境和使用过程入手,提升UPS工作的稳定性。

2、规范电力演练相关应急预案的编制,电力演练预案不同于主机操作系统等预案,技术层面的细节比较少,但更应该做好演练过程中发生意外(如UPS机组故障、蓄电池爆炸等极端情况)的应对预案。

3、对机房配电系统形成全方位监控体系,梳理可能暴露出风险的隐患点,如是否出现落后单体蓄电池、整租蓄电池的容量是否有下降、UPS输入输出柜、动力配电柜、制冷系统等。

4、对日常电力演练做充分总结,提升演练质量,如演练阶段,市电断电1小时后,UPS供电期间,机房温度上升,送入新风,启动柴油发电机组的时间点如何确定等。

5、充分准备应急措施资源的容量,对于电力演练,是考验UPS蓄电池、柴油发电机组等一系列应急措施的时候。

从福岛事件中,我们要深刻反思,如果我们的应急发电设施,在面对相同灾难时候,是否能抵御如此长时间的考验,如果不能,我们是否应该对我们的应急预案进行完善,提升应急电力措施的保障力度。

收起
银行 · 2017-03-29
浏览1801

提问者

avril024
数据库运维工程师北京同为科技有限公司
擅长领域: 存储数据安全数据保护

问题来自

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2017-03-27
  • 关注会员:3 人
  • 问题浏览:5014
  • 最近回答:2017-03-29
  • X社区推广