"运维管理那点事儿"有奖征集活动(2月18日~3月29日)

在实际的运维管理工作中,大家都面临哪些难题?困惑于在业务运行到关键时刻的系统故障问题,业务各个环节都面临停顿的风险;需要平衡IT服务质量和有效资源的矛盾,需要引导业务部门设定合理的期望;无法有效管理多供应商环境、对各供应商的职责难以划分;缺乏统一操作规范和流程,无法预...显示全部

在实际的运维管理工作中,大家都面临哪些难题?

困惑于在业务运行到关键时刻的系统故障问题,业务各个环节都面临停顿的风险;

需要平衡IT服务质量和有效资源的矛盾,需要引导业务部门设定合理的期望;

无法有效管理多供应商环境、对各供应商的职责难以划分;

缺乏统一操作规范和流程,无法预防误操作的发生并缺乏有效的监控和问题诊断;

缺乏流程管控和自动化工具,无法有效提升IT运维的效率和成效。

从2月18日起,到3月29日,AIX专家俱乐部社区将举办一个“运维管理那点事儿”的有奖征集活动,欢迎广大负责运维的朋友来参与,吐槽你们在运维中的各种问题以及遇到的难题,如果您的问题能够得到更多运维朋友的共鸣就可以获得我们的微信红包奖励(仅限前十位,以点赞的数量多少为排序标准。活动结束后,管理员会给前十位的运维朋友发送微信红包奖励)

“运维管理那点事儿”征集问题格式:

1、企业日常运维面临的难题:*********************;

2、对维保服务商的吐槽以及建议:*********************

参与方式,在本活动贴下根据问题格式进行直接回复即可。

活动征集时间:2月18日——3月29日

(备注:征集到大家集中关心的部分问题,我们后续会举办这方面的专业交流以及会收集来自社区专家、厂商的经验分享给大家)

推荐相关资料:

《IT运维管理实用资料集锦》,共10份资料:

http://www.aixchina.net/club/viewthread.php?tid=178751

收起
参与303

查看其它 18 个回答whyexe的回答

whyexewhyexe  存储架构师 , 中国金融电子化公司

做运维 和MA几年来总结了一些经验和大家分享:

1,客户类型,系统紧要程度,金融用户就比较紧张,一些中小企业相对没有那么大的压力,维护现场气氛不要过于凝固,往往在轻松的环境效率会更高,在新华社一次小机宕机,备机没有接管,我当时有一点紧张,第一接触比较紧急的case,领导说不用管那么多按照你的思路在做,支持你。给你很大的鼓励,干活也轻松了。查资料都很自如,思路都没有问题,很快把问题处理了,不要因为客户着急,催促,某某大领导站在后面,不用怕,他们不懂。你只要说出你处理和思路和预期结果就行。

2,处理方法:比如小机power服务器更换备件,准备的东西,系统能起来一定做系统备份,我们也督促客户做系统备份,客户就让现场工程师来备份太浪费时间,时间紧急没有备份,系统恢复用了3个小时,不备份的系统不做变更,特别涉及到停机的,一个忠告:不要打破自己的底线,否则受伤是自己,处理故障出了意外,不要抱怨太多,安心总结经验,会更好。下次客户还会认可你。

  小机故障定位 硬件和软件要首先判断出来,然后硬件的问题,集中几个问题,内存,风扇,电源,几类常规报错的现场要记住,机器不起机,80%来自内存,风扇,电源等,几率排查,这些都失效,考虑VPD ,根据手册去查,没有一个人对所有故障了如指掌的,业内一些专家一个建议,一个忠告有可能就能拯救你,比如换存储电池,等电池彻底失效在去更换,提示后自己操作事半功倍。在圈里慢慢成长。处理过的case 自己做一个自己的case库。

故障分析:对一些不可控的故障,不要随便操作,超出自己范围让公司去协调其他人,自己不要随便玩,客户也不会说你技术差,case 不要留一半。做操作信息收集全,不要急躁,不要蛮干,有时候更换东西的心里总是祈祷,上帝会帮助我,每次成功都会有成就感。

对维保的吐槽和建议:

操作习惯:停机操作,关机后看HBA卡,电源灯是不是灭了。然后在操作,微小的环节也要注意,按照正规的流程去操作,没有解决不了的问题,不用担心故障多大,始终遵守规则,不乱操作。多方协商。如果有人故意强调多少时间必须完成,你可以告诉他,我可以按照流程和规范操作具体多长时间,我无法估计,会尽快的搞好。最好留一个机器窗口这样减少误操作,很多大故障都是误操作造成的。

特别是数据丢失的恢复,这个远远比硬件困难,文件系统丢失,磁盘阵列信息丢失,数据库文件丢失,要做好充分准备在去操作,必须时让数据专家到现场恢复,一旦数据灾难超出自己能力范围,不要错上加错,小心驶得万年船,会让你的运维变得更轻松,升级也会很容易。 希望以上经验会帮助大家。

操作手册准备:升级难度大的,必要操作手册,减少失误,必须经过测试在去现场实施,否则故障来的突然无法控制。

互联网服务 · 2016-02-25
浏览4079

回答者

whyexe
存储架构师中国金融电子化公司
擅长领域: 服务器AIXUnix

whyexe 最近回答过的问题

回答状态

  • 发布时间:2016-02-25
  • 关注会员:42 人
  • 回答浏览:4079
  • X社区推广