1、企业日常运维面临的难题。
1)运维管理架构科学性及合理性管理。一个企业的运维可能已经经历了很多年、很多人,系统发生过很多次的变更。没有人能说清楚系统整体的架构及脉络,没人认敢去做大的架构变更或者改动。只要系统没有故障,就那么跑着,忍受系统陈旧不堪、忍受系统性能不足,忍受一系列的问题。
2)运维管理及作业规范化。很多企业的运维,缺乏标准化的管理。同样一个表空间的扩容作业,可能能做出若干种来。作业手册里面仅有如何做,从来没有做错了如何回退或者如何杜绝错误的指导。每一步作业,甚至五花八门。
3)只有当前运维,没有预警及规划。不管是监控软件,还是认为的巡检,似乎只关注当前的状态。很少有机制或者专职岗位去根据当前的信息对未来的使用或者运维进行一个规划或者预测。比如我们可以把系统中收集下来的当前及历史信息,用一种科学的方法来进行分析和判断,从而知道我们的资源规划及发展。
4)过渡依赖厂家,设备的硬件上,我们可以依赖厂家。但是架构的设计、实施以及运维,软件功能的使用上也依赖厂家的话。那么企业自己的运维人员就缺乏对系统的全面掌控。一但厂家不可靠,这个系统就变成僵尸了,没人敢动,没人敢改。更别说系统的灵活性及扩展性了。
5)过渡依赖监控软件,似乎上了监控软件就完事大吉了,没人去研究它是怎么监控的,监控的准不准。更没有人去关心监控软件底层实现的改进以及再利用。
6)预案与演练,其实每一个发生过重大IT故障的企业,我相信他们都有风险预案,甚至故障演练。但是故障还是发生了,甚至发生之后没有任何有效措施。你懂!
2、对维保服务商的吐槽以及建议。
1)维保服务商承诺的SLA,其实我认为这个都是面儿上的东西。承诺1小时到场,结果又是连线后线工程师又是连线国外工程师的,结果3天才解决问题。有什么用。还不如多花点心思把自己的基础架构搞结实。
2)厂家说的功能和你理解的功能。其实对于很多技术来讲,可以有很多种理解方法。有时候厂家承诺你的功能,不一定是你理解的那种。要研究到深处,自己去弄明白。不要光听别人说。人家一定会往最好的地方说。