pysx0503
作者pysx0503·2022-01-11 14:42
系统工程师·第十区。散人

现代企业信息化综合运维管理实例

字数 3657阅读 2815评论 0赞 2

摘要: 信息技术运行维护(简称:IT运维)是信息系统全生命周期中的重要阶段,对系统主要提供维护和技术支持以及其它相关的支持和服务。运维阶段包括对系统和服务的咨询评估、例行操作、响应支持和优化改善以及性能监视、事件和问题识别和分类,并报告系统和服务的运行情况 。

关键词: 基础服务 , 性能优化服务 , 基础资料维护。

“__这是一个最好的时代,也是一个最坏的时代;这是一个智慧的年代,这是一个愚蠢的年代;这是一个信任的时期,这是一个怀疑的时期。__” 这段话出自 狄更斯笔 下的《双城记》,描述的是 18世纪轰轰烈烈的法国 , 这段话同样适合今天这个瞬息万变的信息化社会。

网络和信息化的发展使现代企业发生了巨大的变革,互联网缩短了信息传递的周期,信息化推进了企业的生产和管理效率,对企业发展产生深层次和长远的影响。企业管理思想、管理方式、组织结构、生产和销售方式都将因企业信息化的推进而发生质的变化。数字化,信息化引发的数字革命推动着社会从工业社会发展到信息社会。

由各种设备连接组成的信息化网络形成了这个虚拟化的信息社会,网络缩短了世界的距离,缩短了时间。人们在这个虚拟的网络上如同魔术师一样可以随意搭建高楼大厦和各种各样的建筑,这个虚拟的信息化社会也变得多姿多彩,魅力无穷。

但人们在享受互联网信息化带来的变革的同时,也开始越来越多的面临着这种变革所产生的问题。 如何监管支撑整个虚拟社会的信息系统健康运行给IT运维人员也提出了更高的要求。

  1. 对业务状态的监控。**

现代社会对信息化的依赖程度非常严重,上线的应用系统数量越来越多,周期越来越短。各种新技术堆砌成一个个庞大复杂的业务系统,任何一个微小的问题都可能会影响我们的现实生活,这就要求运维人员要时时刻刻盯着这个虚拟的网络,防止故障的发生。

  1. 对系统性能的监控。**

复杂而庞大的信息化系统由各种软件,硬件组成,网络设备、服务器、存储、操作系统、应用软件融合成为一个整体,任何一个环节运行不佳都会使整体业务运行出现问题,就好像木板组成的水桶,一块短板就会降低整个水桶的使用效率。

  1. 基础动环的监控。**

作为承载所有设备的数据中心,物理环境的可靠性也至关重要。机房的温度、湿度、精密空调和UPS的运行状态都会直接影响设备的健康度。特别是高温,漏水,意外断电造成的危害甚至会使整个数据中心的瘫痪。

  1. 基础资料维护。**

现代信息化由无数的设备、网络、软件、和资源堆砌组成。这些资源的基础信息越来越多也越来越繁杂,相互之间又紧密的联系着。基础资料是整个信息系统的蓝图,但却经常被忽略。

实际应用案例**

现代化的企业已经开始十分依赖于信息化,尽管现在的信息化系统都在朝着更快,更稳定,更便捷的方向发展,但整套信息化系统也在不可避免的变得越来越庞大,越来越复杂。包括信息中心在内的整套信息系统运维已经成了 信息系统全生命周期中 最重要的部分。如何去解决这些问题,用最少的投资实现最大化的回报,成了现代化企业信息化运维管理的一个难题。本文介绍了某企业数据中心怎样用最少的投资实现实现信息化综合管理,为大家提供一个信息化综合运维管理构建思路。

  1. Hostmonitor实现业务状态的监控。

HostMonitor是一个网络监测工具,能够定时地监视Server主机的TCP、Port 、 服务是否正常运作 、 URL是否存在、硬盘空间,当这些 监控出现问题 时,便会 、 以声音、Email错误信息、启动指定程序等方式通知管理员 。 HostMonitor 可以代替人工实现对所有应用业务,系统资源,网络状态的监控,根据需求定制不同的巡检周期,减少了运维人员的工作量,提高了效率,可以更为及时的发现问题。
**

HostMonitor 的监控内容非常全面,可以监控网络协议、系统CPU、内存、磁盘空间等资源,还可以监控系统进程、数据库服务状态、测试邮件、LDAP、DNS等服务,测试的周期可以根据需要设定,最小间隔为1秒。

报警的方式可以自定义,如声音、弹屏、短信或者邮件,由于短信推送需要短信网关设备,在这里我选择了邮件推送,通过手机的邮件提醒代替了短信。

软件可以查看监测项的详细日志报表。

程序本身是C/S架构的,但通过程序自带的WEBSERVER发布,可以实现B/S的浏览

HostMonitor 是一款很容易上手的软件,监控设置比较简单,目录清单的界面展示业务状态,系统资源等检测的结果也比较清晰。每一次业务状态的改变都会产生记录,可以直观的看出哪些业务在什么时间出现了中断,辅助运维人员分析判断问题。通过定时巡检代替人工的业务巡检,实现人工所无法实现的监测频率和自动报警,这点对于运维人员少,业务重要的企业尤为重要。

不过软件缺乏全局整体的监控画面,监控项只能以清单方式显示,全局汇总报表展示的信息过于简单,只是概括性的显示监控内容的汇总和排名情况。

  1. Zabbix实现系统性能的监控。**

Zabbix 是一个基于 [WEB界面 , 提供分布式 [系统监视] 以及网络监视功能的企业级的开源解决方案 , 它弥补了 HostMonitor 在全局监控等方面的欠缺, 通过 [SNMP] Zabbix agent 、 [P ing]端口监视等方法提供对远程 设备 /网络状态的监视 。

不同于 HostMonitor 的状态监测,Zabbix对业务的监视结果是更为直观的连续视图,可以为运维人员提供更详细的分析。例如,通过服务器的CPU、内存、磁盘IO、网络吞吐量等信息的图表来判断业务缓慢时各个系统资源是否占用过高,是否有其他相关联的信息发生了变化等等。

它可以结合设备资源状态和网络流量等数据绘制网络拓扑图。

结合实际环境绘制的拓扑图上直接显示了关键节点的资源利用率和网络流量等信息,可以辅助管理员快速排查问题。

Zabbix主机监控项的图形展示是下拉菜单方式选择,如果想要实现监控信息的汇总需要手工配置聚合图形,这一点有些麻烦,不过很多Zabbix的扩展软件弥补了这一点。

Graphtree是Zabbix的一款插件,可以使Zabbix监控内容以主机为单位归类展示。

针对Zabbix图表样式单调的情况,可以采用Grafana来展示,Grafana可以将Zabbix作为数据源,把Zabbix中的数据获取生成更多样式的图表。 不仅可以自定义图表界面,还可以自定义图表的内容,使整个数据展示更为多样化。

Zabbix作为开源软件,功能十分的强大,网上的资料和配套的插件工具也很丰富。缺点就是配置起来相对复杂,每一个监控点都需要配置SNMP协议或者安装agent代理,特别是一些设备没有标准模板时,需要针对设备自己编写监控信息。

  1. 机房动环系统保障数据中心物理安全。**

本案例中的数据中心并不是24小时值守,所以针对机房的动力环境监测特别是UPS输入输出、空调运行状态、室温等信息的监测就更加重要。

动环监测系统对接UPS、精密空调、温湿度探针、烟感等设备实现对机房动力和环境的全面监测,自动报警。配合电子门禁,远程监控,针对缺少24小时值守的数据中心可以时刻远程掌控数据中心状态,避免因为动力环境出现问题导致业务系统的意外宕机。

  1. Glpi建立基础信息管理

GLPI是法语 Gestionnairelibredeparcinf orm atique 的缩写, 是一款优秀的 开源IT和 可视化的 资产管理软件 , GLPI提供功能全面的IT资源管理接口,你可以用它来建立数据库全面管理IT的电脑,显示器,服务器,打印机,网络设备,电话,甚至硒鼓和墨盒等。


GLPI 的功能非常强大、小到硬盘、内存等配件,大到服务器机柜、数据中心机房,从设备数量到电源功耗、外观规格、网络线路、域名证书,都可以进行详细的登记,相互关联,形成完整的资产管理体系。



数据中心的设备,可以通过图形和文档的方式详细记录配件详细信息、相关合同和技术文档、现存问题等,帮助运维人员全面掌握设备的基础信息,共享相关资料,更为直观的显示设备的安装位置甚至设备在机架上具体的高度,重量等信息。

还有很多运维工具都可是实现本案例中的功能,一些专业的商用网管软件还可以实现统一的运维管理平台。本例中更多的采用了功能强大,技术成熟的开源产品。虽然配置过程相对复杂,但对于多数中小企业来说,这种开源产品可以减少企业运维的投资成本,整个运维系统构建的过程也可以帮助企业更好的梳理和了解自身的业务系统,逐渐形成适合企业自身的运维管理体系。

现代信息化的运维管理已经不再是简单的运行维护。多数中小企业,无法实现精细的运维分工,运维人员往往成了万金油一样的角色对接多个部门。要负责为上层的业务部门提供基础保障,与软件研发一起找出业务运行中的问题,排除各个终端的各种问题,配合财务等部门盘点固定资产,看似琐碎的工作却是整个信息系统健康运行的根基。越来越多的企业在经历数据中心建设时期后开始重视信息化的维护,逐渐从传统的设备运行维护转向现代企业信息化的综合运维管理阶段。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

2

添加新评论0 条评论

Ctrl+Enter 发表

本文隶属于专栏

最佳实践
不同的领域,都有先行者,实践者,用他们的最佳实践来加速更多企业的建设项目落地。

作者其他文章

相关文章

相关问题

相关资料

X社区推广