海量运维监控系统规划与部署分享

正在加载中...

试读已结束

继续阅读请 5 金币购买后下载

立即下载

资料简介:

本书针对海量IT系统的特点,不仅提倡IT运维监控系统要基于Nagios和Centreon等开源系统量身定做,采取开源监控技术与企业IT服务和运维管理流程相结合的技术路线,而且从开源监控系统的规划、管理、流程/规范、系统/平台、监控、告警、安全、部署实施、优化、考核、持续优化和提升等诸多方面来与大家详细分享体会。

本书共分14章 涵盖的内容主要包括:

1、带领读者深度了解 Nagios和Centreon如何在Linux系统上部署,以及如何与NagVis进行集成

2、从专家角度介绍如何管理Centreon、Nagios和NagVis,以及如何运用相关技巧优化这套组件以提升监控系统效率

3、运用大量脚本样例和截图,手把手帮助读者解决在构建开源监控系统中遇到的各类实际问题

4、利用NagVis和RRDTool 集成开源监控系统的视图功能

5、按部就班地协助用户定制化实现既符合ITIL最佳实践,又符合企业自身特点的企业级IT运维监控系统

目录

1企业级IT监控系统概述
1.1什么是IT运维监控系统
1.2开源监控软件之崛起-Linux、Nagios、Centreon和NagVis
1.3Nagios简介
1.3.1云计算和海量运维监控的最佳选择
1.3.2Nagios的主机检测与服务检测
1.3.3监控信息的提供者
1.3.4及时的通知机制
1.3.5从外部系统接收信息
1.3.6Nagios与Linux的关系
1.4Centreon简介
1.4.1Centreon引擎
1.4.2为什么要有Centreon引擎
1.5NagVis简介
1.6为什么要基于开源软件构建IT运维监控系统?
2企业级IT运维监控系统的构建-从源代码到企业级系统
2.1可供选择的操作系统
2.1.1选用Red Hat Enterprise Linux作为操作系统
2.1.2选择部署方式
2.2服务器安装规划
2.2.1服务器参数规划
2.2.2服务器存储规划
2.3Linux的逻辑卷(LVM)管理机制
2.3.1为什么要使用LVM
2.3.2LVM基本概念
2.3.3操作系统分区划分样例
3配置VMWARE虚拟机
3.1新建虚拟机向导
3.2VMware的联网模式简介
3.2.1虚拟网络设备
3.2.2虚拟机联网方式之桥接模式(bridged networking)
3.2.3虚拟机联网方式之网络地址转换(network address translation,简称NAT)模式
3.2.4虚拟机联网方式之仅主机(host-only networking)模式
3.2.5关于虚拟机联网方式中的DHCP服务
3.2.6选择Nagios虚拟服务器的联网方式
3.3完成虚拟机创建向导并查看配置清单
4为虚拟机安装RHEL操作系统
4.1引导菜单
4.2操作系统安装欢迎界面(语言及键盘布局)
4.3存储设备选择
4.4主机名与网络设置
4.5时区选择
4.6磁盘分区设置
4.7划分文件系统
4.8安装操作系统软件
4.8.1格式化虚拟机硬盘
4.8.2选择操作系统安装类型
4.8.3安装操作系统
4.8.4操作系统初始化配置
4.8.5创建操作系统账户
4.8.6设置操作系统时间
4.8.7设置Kdump
4.8.8操作系统网络配置
4.8.9yum源配置
5Nagios的安装
5.1Nagios安装前的准备工作
5.2创建Nagios用户和组
5.3编译并安装Nagios
5.4安装Nagios插件
5.5配置Nagios的WEB用户界面
5.6SELinux
5.7访问用户认证与授权
6NDOUtils安装
6.1配置并编译NDOUtils
6.2拷贝编译后的文件至运行目录
6.3检查MySQL的配置
6.4创建NDOUtils数据库表
6.5配置NDOUtils
6.6添加ndo2db为系统服务
7Centreon的安装与配置
7.1什么是监控以及如何监控
7.1.1监控已经不再局限于基础设施
7.1.2基础设施监控
7.1.3应用程序监控
7.1.4SLA监控
7.1.5业务活动监控
7.2究竟什么是运维监控
7.2.1运维监控的原则
7.2.2主动监控模式
7.2.3被动监控模式
7.3SNMP
7.4Centreon-不仅仅是包装后的Nagios
7.4.1MERETHIS公司简介
7.4.2Centreon的功能
7.5Centreon的架构
7.5.1系统组件
7.5.2数据存储
7.5.3检测命令
7.5.4调度进程
7.5.5其他兼容Centreon的调度引擎
7.5.6代理进程
7.6后台服务和定时任务
7.6.1centcore服务
7.6.2centstorage服务
7.6.3定时任务
7.7系统架构-简洁及分布式
7.8捕获SNNP trap告警信息
8Centreon的安装
8.1安装前提
8.2安装Centreon监控系统中央服务器
8.2.1系统软件需求
8.2.2部署Centreon监控系统
8.3安装后配置
8.4Centreon的WEB用户界面
8.5Centreon的语言设置
8.6Centreon的数据库连接配置
8.7通过Centreon激活Nagios监控
8.8安装过程中的问题解决
8.8.1Export时显示sudo相关错误
8.8.2在/var/log/messages中出现Warning: queue send error错误
9Centreon的管理
9.1Centreon的调度进程和代理进程
9.2Centreon对于Nagios调度进程的管理
9.2.1Files选项卡
9.2.2Check Options选项卡
9.2.3Log Options 选项卡
9.2.4Data选项卡
9.2.5Tuning选项卡
9.2.6Admin选项卡
9.2.7Debug选项卡
9.3Centreon对于NDOUtils代理进程的管理
9.3.1General选项卡:
9.3.2Database选项卡:
9.3.3Retention选项卡
9.4Centreon对于ndomod的管理
9.5Centreon的实时监控
9.5.1主机和主机组
9.5.2服务、服务组和元服务
9.5.3硬状态和软状态
9.5.4状态波动与状态特殊震荡
10Centreon的实时监控
10.1专注于实时监控的Centreon
10.2Centreon的通用监控
10.3状态总揽视图
10.4全局健康视图
10.5主机的实时监控
10.6主机的详细信息视图
10.7服务的实时监控
10.8在实时监控界面中进行监控项相关操作
10.8.1主机和服务操作概述
10.8.2处于告警状态下的主机或者服务进行确认
10.8.3计划停机
10.8.4添加备注
10.8.5对于调度任务的直接控制
11Centreon的配置
11.1Centreon的监控对象模型
11.2通用功能配置界面
11.3Nagios配置文件的生成与部署
11.4宏、检测命令与检测插件
11.5检测命令与检测插件
11.6执行周期
11.7主机模板和服务模板
11.8主机和主机组
11.9主机的配置界面
11.9.1通用配置选项卡
11.9.2“关系”选项卡
11.9.3“数据处理”选项卡
11.9.4“主机扩展信息”选项卡
11.10主机组
11.11服务
11.11.1“服务配置”选项卡
11.11.2“关系”选项卡
11.11.3“数据处理”选项卡
11.12元服务
11.13被动监控模式和SNMP trap(SNMP陷阱)
11.14通知
11.14.1通知策略定义
11.14.2为主机和服务配置通知策略
11.15通知消息联系人、联系人组以及联系人模板
11.15.1配置通知消息联系人/用户
11.16Commands通知命令
11.17Escalation-告警通知的升级
11.18性能图形
11.18.1相关定义
11.18.2查看图形与进一步分析
11.18.3配置性能图形相关属性
11.18.4配置性能曲线相关属性
11.19利用性能图形实现早期预警
11.20报表
12Centreon的管理和优化
12.1Centreon的管理菜单
12.2通用选项
12.2.1Centreon的通用选项界面
12.2.2Centreon的监控选项界面
12.3CentStorage的相关配置
12.3.1性能数据的配置管理
12.3.2度量和计量
12.3.3监控性能指标的相关操作
12.4访问控制列表(ACL)
12.4.1访问控制列表的配置与管理
12.4.2访问组
12.5调度进程的运行时统计信息
12.6Centreon监控平台的备份与恢复
13NagVis的安装与配置
13.1NagVis的地图
13.2NagVis的运作机制
13.3NagVis的安装
13.4Nagvis的配置
13.4.1配置NagVis的默认参数
13.4.2配置NagVis的后台数据源
13.5NagVis地图介绍
13.6NagVis的地图的配置管理
13.7NagVis中背景图片的管理
13.8配置NagVis的监控地图
13.9设置NagVis图标的超链接
13.10设置NagVis的WEB界面为自动登录
14构建企业级IT运维监控系统
14.1IT服务管理和ITIL
14.2IT运维监控系统与ITIL的关系
14.2.1ITIL的产生与发展
14.2.2ITIL的管理框架简介
14.2.3运用ITIL解决企业IT服务管理面临的问题
14.3企业级IT运维监控系统的构建与实施
14.3.1咨询与梳理步骤
14.3.2互联网运维监控实践
14.3.3提升监控及预警能力
14.3.4监控及预警质量的持续改进

2020-02-06
页数360
浏览4200
下载50

已下载用户的评价8.11分

您还未下载该资料,不能发表评价;
查看我的 待评价资源
colerofyoucolerofyou   系统架构师 , SUN2020-11-05
有用
好东西,谢谢。
thedarkexilethedarkexile   it技术咨询顾问 , bcia2020-05-28
有用
我是作者,这样下载不好吧,为啥不买正版支持呢?
和谐之声和谐之声   系统运维工程师 , 中银保信2020-05-26
有用
学习学习,谢谢分享
Hank_hanHank_han   工程师 , 某2020-05-21
有用
很实用的内容
study123study123   系统架构师 , ERICSSON2020-02-17
有用
非常好,值得下载参考。 谢谢分享!
dinglianzandinglianzan   技术经理 , 保险2020-02-17
有用
有用感谢分享
baizhaoxianbaizhaoxian   容灾备份管理工程师 , 无2020-02-07
有用
感谢分享!

贡献者

eric系统运维工程师,某金融单位
X社区推广