power6、power7问题高发期如何减少或避免损失

我们p6 p7等主机已经进入部件损坏高发期,怎么样才能减少宕机带来的业务损失呢?有什么好办法(别说买了全部换,这个到哪儿都不可能)

4回答

peterzhupeterzhu  系统工程师 , Nanjing Digital China Limited
chenguowei8908jilaoshi871218wuwenpin等赞同了此回答
1,首先,最好有第三方或原厂维保做支撑,一方面增强技术后备,另外一方面能很快得到备品备件。2,其次,了解整体系统架构,查看有无单点故障,可尝试做双机集群环境。3,上一些成熟的灾备方案,确保无论什么极端环境,做到不丢或少丢数据。4,形成长效的巡检巡查机制,有条件的话最好让维保商提供...显示全部

1,首先,最好有第三方或原厂维保做支撑,一方面增强技术后备,另外一方面能很快得到备品备件。

2,其次,了解整体系统架构,查看有无单点故障,可尝试做双机集群环境。

3,上一些成熟的灾备方案,确保无论什么极端环境,做到不丢或少丢数据。

4,形成长效的巡检巡查机制,有条件的话最好让维保商提供驻场服务,早发现问题,早处理,省得被动。

收起
 2017-02-14
浏览731
董志卫董志卫  系统架构师 , 李宁(中国)体育用品有限公司
还是有钱的企业多啊,power6和power7 都退役了,我们power5还用的刚刚的,这个东西不能一概而论,MA还是要的,其他的只是软件方面的问题了,硬件问题根据设备年限和生产批次不同或者缺陷,有各种各样的问题。高可用,一倍多,分布式,选择适合的就好。...显示全部

还是有钱的企业多啊,power6和power7 都退役了,我们power5还用的刚刚的,这个东西不能一概而论,MA还是要的,其他的只是软件方面的问题了,硬件问题根据设备年限和生产批次不同或者缺陷,有各种各样的问题。

高可用,一倍多,分布式,选择适合的就好。

收起
 2017-02-17
浏览650
王巧雷王巧雷  系统工程师 , sino-bridge
正常用即可,自然趋势,无法阻挡。但是我们可以从业务或优先级方面做一些梳理和分析,在此基础上做调整。比如1. 业务重要,优先级高的。架构方面尽量避免单点故障,有条件就多调整点,比如,aix的hacmp,oracle的dg stream等。条件不具备把硬件本身的做好,重要部件冗余,双电源 双电源线路 ...显示全部

正常用即可,自然趋势,无法阻挡。

但是我们可以从业务或优先级方面做一些梳理和分析,在此基础上做调整。比如

1. 业务重要,优先级高的。架构方面尽量避免单点故障,有条件就多调整点,比如,aix的hacmp,oracle的dg stream等。条件不具备把硬件本身的做好,重要部件冗余,双电源 双电源线路 ups  、多风扇等。如570,cec的vrm配满三个等等

2.日常健康监控备份等运维工作做好

3. 购买维保服务,根据业务优先级  买对应服务级别的维保。比如级别高的7*24*2  现场备件库或备机都可以做到


总之,是由业务本身的sla决定的,现有环境不能大调只能在运维、服务以及架构上多下点功夫  去补齐短板了

收起
 2017-02-17
浏览622
张文正张文正  系统工程师 , 神州数码系统集成服务有限公司
放到非生产环境下,做开发测试用;如果还想继续使用,做集群高可用性架构显示全部

放到非生产环境下,做开发测试用;如果还想继续使用,做集群高可用性架构

收起
 2017-02-14
浏览610

提问者

yujin2010good系统工程师, 大型零售巨头

问题状态

  • 发布时间:2017-02-14
  • 关注会员:6 人
  • 问题浏览:4104
  • 最近回答:2017-02-17
  • 关于TWT  使用指南  社区专家合作  厂商入驻社区  企业招聘  投诉建议  版权与免责声明  联系我们
    © 2019  talkwithtrend — talk with trend,talk with technologist 京ICP备09031017号-30