power6、power7问题高发期如何减少或避免损失

我们p6 p7等主机已经进入部件损坏高发期,怎么样才能减少宕机带来的业务损失呢?有什么好办法(别说买了全部换,这个到哪儿都不可能)

4回答

peterzhupeterzhu  系统工程师 , Nanjing Digital China Limited
chenguowei8908jilaoshi871218wuwenpin等赞同了此回答
1,首先,最好有第三方或原厂维保做支撑,一方面增强技术后备,另外一方面能很快得到备品备件。2,其次,了解整体系统架构,查看有无单点故障,可尝试做双机集群环境。3,上一些成熟的灾备方案,确保无论什么极端环境,做到不丢或少丢数据。4,形成长效的巡检巡查机制,有条件的话最好让维保商提供...显示全部

1,首先,最好有第三方或原厂维保做支撑,一方面增强技术后备,另外一方面能很快得到备品备件。

2,其次,了解整体系统架构,查看有无单点故障,可尝试做双机集群环境。

3,上一些成熟的灾备方案,确保无论什么极端环境,做到不丢或少丢数据。

4,形成长效的巡检巡查机制,有条件的话最好让维保商提供驻场服务,早发现问题,早处理,省得被动。

收起
 2017-02-14
浏览1089
董志卫董志卫  系统架构师 , 李宁(中国)体育用品有限公司
还是有钱的企业多啊,power6和power7 都退役了,我们power5还用的刚刚的,这个东西不能一概而论,MA还是要的,其他的只是软件方面的问题了,硬件问题根据设备年限和生产批次不同或者缺陷,有各种各样的问题。高可用,一倍多,分布式,选择适合的就好。...显示全部

还是有钱的企业多啊,power6和power7 都退役了,我们power5还用的刚刚的,这个东西不能一概而论,MA还是要的,其他的只是软件方面的问题了,硬件问题根据设备年限和生产批次不同或者缺陷,有各种各样的问题。

高可用,一倍多,分布式,选择适合的就好。

收起
 2017-02-17
浏览1028
王巧雷王巧雷  系统工程师 , sino-bridge
正常用即可,自然趋势,无法阻挡。但是我们可以从业务或优先级方面做一些梳理和分析,在此基础上做调整。比如1. 业务重要,优先级高的。架构方面尽量避免单点故障,有条件就多调整点,比如,aix的hacmp,oracle的dg stream等。条件不具备把硬件本身的做好,重要部件冗余,双电源 双电源线路 ...显示全部

正常用即可,自然趋势,无法阻挡。

但是我们可以从业务或优先级方面做一些梳理和分析,在此基础上做调整。比如

1. 业务重要,优先级高的。架构方面尽量避免单点故障,有条件就多调整点,比如,aix的hacmp,oracle的dg stream等。条件不具备把硬件本身的做好,重要部件冗余,双电源 双电源线路 ups  、多风扇等。如570,cec的vrm配满三个等等

2.日常健康监控备份等运维工作做好

3. 购买维保服务,根据业务优先级  买对应服务级别的维保。比如级别高的7*24*2  现场备件库或备机都可以做到


总之,是由业务本身的sla决定的,现有环境不能大调只能在运维、服务以及架构上多下点功夫  去补齐短板了

收起
 2017-02-17
浏览969
张文正张文正  系统工程师 , dcits
放到非生产环境下,做开发测试用;如果还想继续使用,做集群高可用性架构显示全部

放到非生产环境下,做开发测试用;如果还想继续使用,做集群高可用性架构

收起
 2017-02-14
浏览971

提问者

yujin2010good系统工程师, 大型零售巨头
相关推广
  • 2020 容器云职业技能大赛运维岗课程系列之—容器云平台的日常故障处理
    近年来,容器技术的发展也非常迅猛,以docker和kubernetes为代表的容器技术日新月异,但我们也在容器的使用过程中碰到各种困扰和难题。本文针对Docker容器和kubernetes集群安装,部署,维护过程中,产生的问题和故障,做出有针对性的说明和解决方案,希望可以帮助到大家去快速定位和解决类似问题故障。
  • 核心数据库服务器选型优先顺序调查

    发表您的选型观点,参与即得50金币。

    问题状态

  • 发布时间:2017-02-14
  • 关注会员:6 人
  • 问题浏览:4637
  • 最近回答:2017-02-17