新云监控的安装与使用

关于新云监控

   

新云监控是北京新数科技有限公司(简称:新数科技)根据多年来在DB2 LUW产品上的耕耘,集合多位原IBM中国实验室的资深数据库专家,结合数十行业客户的实践经验,潜心开发出的业界领先的智能化、自动化、主动告警式且简洁易用的专业DB2运维监控与调优工具。

   

本文以最新发布的新云监控V2.1版本为例,介绍新云监控系统的安装和基本使用过程,供客户和相关从业者参考。

   

新云监控的安装

   

新云监控有Windows版和Linux版,支持这两种平台的部署使用,下文将分别下载其安装介质并安装。

   

首先通过新数科技官方网站提供的链接下载到ndtm-V2.1.rar和ndtm-V2.1.tar.gz。

   

      Windows版安装:

   

1、解压rar压缩包,这里我们直接解压至D盘为例。

   

2、以“管理员身份运行”setup.bat。

   

   

3、安装完成后按任意键退出

   

   

4、双击该目录下的新云监控快捷方式即跳转到浏览器登录页面

   

   

至此,Windows版安装成功,除去解压缩部分,整个安装过程在30秒内完成。

   

      Linux版安装:

   

1、解压后,直接以root用户运行setup.sh

   

   

2、通过本地浏览器打开登录页面,链接为http://:8080/db2mon

   

   

至此安装完成!

   

以上可见,无论Windows平台还是Linux平台,均为一键式绿色安装,非常便捷。

   

新云监控之全体验

   

1、首次登陆、授权:在登录页面以“admin”作为初始用户名和密码登录及到软件授权页面,新云监控提供安装即获取临时授权:

   

   

2、点击“提交”即完成临时授权生成

   

   

3、通过配置—数据库配置页面添加目标数据库,此处以添加一套pureScale数据库为例,以此添加数据库名、别名、IP、端口号、用户名、类型(选择pureScale)、密码,保存。

   

   

4、配置监控项:选择所需监控项

   

   

5、此时,看到“通知”显示为“关闭”,默认情况下对告警不通过邮箱发送

   

   

6、如果打开“通知”开关,需首先在系统配置页面配置告警邮箱服务器

   

   

7、再回到数据库配置页面编辑对应条目,添加通知邮箱,并打开通知开关

   

   

8、监控一段时间后返回首页,可见sample数据库存在严重警告和一般警告

   

   

9、分别点击严重警告数字和一般警告数字,即进入全局告警页面,而且按相应的告警级别显示

   

   

   

10、在上图中可见部分告警有提醒,部分没有,这是因为最初没有打开通知开关,所以早期的告警没有通知,后来的告警是有通知的,已经发送到了数据库配置页面所设置邮箱中:

   

   

11、返回上方导航栏,进入仪表盘页面,在这里看到有三个红灯,需要管理员特别关注,当鼠标放到红色指示灯时会有对应信息提示:

   

   

   

   

点击红灯后即进入相应监控项所在页面进行进一步观察,并作出反应。

   

12、在备份页面,由于sample数据库从未做任何备份,而在监控项配置页面对备份的默认设置是至少要在7天内有备份,如果超过30天没有备份则为严重告警

   

   

   

13、关于内存和包缓存的报警信息,这里就不一一列举

   

14、返回左侧导航栏,点击实例名称,由于这个库是pureScale类型,可以看到对应实例的拓扑图和相关参数信息

   

   

pureScale是DB2的高级特性,其复杂度很高,而新云监控可以清晰的展示其拓扑图和比较全面的参数信息。

   

15、点击数据库名称,进入数据库基本信息页,这里我们可以看到数据库健康指数,鼠标放到各个打分项上可看到其介绍和原因,有了这个健康指数,管理员可以清晰掌握数据库运行状态;这个页面最吸引人的就是数据库总时间使用分布和数据库等待时间分布,通过这两个图可以清晰看到数据库把时间花在了什么地方,尤其是数据库的等待,这个影响数据库性能的根源,如果有等待,都是在哪里有等待,这为数据库的性能调优提供了至关重要的指导方向,可以大大的提高性能调优的效率。

   

此外,这个页面还展示了数据库信息和服务器信息以及这个数据库的告警信息。

   

   

16、数据库参数页则列出了数据库的配置参数,图中只有member1上的参数,这是由于member0处于异常状态(见上图)

   

   

17、连接页面:首先是一张实时的连接曲线图,可看到两个member当前连接数和当前执行中的连接,在时间选择框里还可以选择不同的时间段看查看特定时间范围内的连接曲线图

   

   

下方的表格则是当前连接的应用信息,点击应用程序句柄看查看其详细信息:

   

   

18、性能页面:总览框里的6个卡片非常直观的展现了最近监控周期内数据库的关键性能指标;

   

   

下面的性能参数展示的信息非常丰富,包括内存信息、缓冲区、缓存、I/O、所统计、锁和锁等待、死锁和锁超时、排序、日志涵盖了数据库性能相关的所有因素,下面我们一一来看:

   

内存信息:分为内存占比图和详情。通过内存占比图我们直观清晰的看到内存的分配使用情况,在详情表格中,点击MemoryPool可查看该部分内存的历史使用情况,下图列出的是APPL-SHARED在过去一小时内的使用情况。

   

   

   

缓冲区:同样以表格和图表的显示展现,表格列出了所有几点上不同缓冲池的名称、命中率、大小、页大小、数据命中率、数据物理读次数、索引命中率和索引物理读次数,有了这些详细信息我们就能够马上判断缓冲池的效率和性能;下方的命中率历史曲线则为追踪过去特定时间范围内缓冲池命中率提供了重要支持,因为运维人员在做性能调试时往往需要关注过去一小时或数小时内的缓冲池命中率。

   

   

缓存:分别展示了编目缓存和包缓存,上文中全局报警页面关于包缓存的告警,此时也仅有65.56%,低于监控配置项中定义的阈值,所以报为严重告警。

   

   

I/O:展示与IO息息相关的因素:物理读写次数、平均物理读写时间、直接读写次数、平均直接读写时间以及异步读写次数和平均异步读写时间,这些指标数据均为性能调优提供了重要支持;下方的曲线图则可以展现过去不同时间段内的IO次数。

   

   

锁是数据库中是不可或缺的,但由于锁带来的性能问题又是困扰运维及调优人员的重要因素。新云监控提供了强大的锁监控功能:

   

锁统计:该页面列出了数据库锁总览、锁等待和锁升级信息以及可以查看锁发生次数的历史曲线图

   

   

锁和锁等待:列出了当前数据库中的锁和锁等待信息,点击应用程序句柄可查看该连接的详细信息。

   

   

   

死锁和锁超时:新云监控提供强大的死锁和锁超时抓取功能,用户只需在这个页面添加监控器,并打开该监控器开关,当数据库中有锁超时和死锁发生时即可抓取到,但由于开启该监控器开关会对数据库性能造成一定影响,所以使用完毕后务必手动关闭该监控器开关。

   

   

排序:表格展示了排序内存大小、排序高水位、总排序时间、平均排序时间、总排序次数、排序溢出次数和当前排序数量;图表则可以展示过去特定时间范围内的排序次数;方便还有追踪特定问题。

   

   

日志:分两个表格展示了在线日志总览和在线日志参数

   

   

19、主机页面:对于pureScale环境,用户可以查看不同member的CPU、内存、磁盘、网络的信息,而且既可以展示实时数据,又可以查看历史数据。下图中所展示的member0的信息,其中CPU和内存是实时数据,磁盘和网络是过去一小时的数据。

   

   

20、存储页面:分别展示了数据库容量及使用情况、数据库增长趋势、数据库表空间编号TOP5、数据库表空间分布情况、表空间和容器详细信息。

   

   

   

   

21、TOP SQL页面:分别列出了当前SQL和SQL总览。

   

   

点击SQL总览中的SQL ID可查看SQL语句的详细内容、指标信息和时间开销分布;SQL指标信息列出了该SQL执行的详细指标信息,包括CPU部分、等待部分、物理读次数、物理读时间、读取行数、返回行数以及期间发生的锁的情况;时间开销图则清晰的展示了该SQL的时间开销分布,方便还有对其进行调优时对症下药,而不是盲目的进行调优。

   

   

点击“生成查询计划”按钮,如果当前库中没有查询计划必须的相关数据表,新云监控提供了一键创建按钮,见下图中“创建查询计划”按钮

   

   

创建成功后,再次点击“生成查询计划”按钮,在查询计划信息页面,我们除了查看查询计划,还可以查看其基本信息和详细信息

   

   

基本信息页:包含了数据库版本、数据库环境和包环境

   

   

详细信息框中则列出了查询计划中每一步的详细信息:

   

   

返回SQL语句详细信息页面,点击“SQL历史分析”按钮进入SQL历史分析页面,这里除了详细展示了SQL语句完整内容,还列出了SQL指标信息、SQL性能关键指标和SQL历史性能曲线;在SQL性能关键指标表格中还提供了指标值的说明和建议;这些说明和建议相对冷冰冰的数据对用户来说则显得意义非凡。

   

   

   

22、大表页面:方便用户快速找到数据库中最大的或者访问频率最高的前30张数据表

   

   

23、诊断日志页面:方便用户从等级、影响和时间范围三个层面快速查看诊断日志

   

   

24、HADR:新云监控从V2.0开始支持HADR,这里我们加入一个HADR数据库来实地看一下,添加完成后直接到HADR页面,在这里首先看到的是HADR Log Gap的曲线图,同样既可以展示实时数据有可以展示过去特定时间段的历史数据。

   

   

25、新云监控还提供了报表功能,报表分别数据库报表和汇总报表,前者是单个库的报表,后者是新云监控中所有被监控数据库的报表信息,报表类型在时间上分别月报、周报、日报

   

   

   

26、最后来看一下配置,新云监控提供了用户配置、数据库配置、系统配置和授权配置

   

用户配置是指新云监控的用户配置,普通用户只有监控功能,只有管理员才有配置管理功能;

   

   

数据库配置前面已经说过,这里不再叙述;

   

系统配置:除了前面说过的告警邮箱服务器配置,还有本地MySQL数据库连接配置、监控间隔时间配置和MySQL数据库连接池配置,根据新云监控白皮书介绍,如无特殊需求还是不要修改,尤其是本地MySQL连接配置。

   

   

   

授权配置:可通过此页面对软件授权进行配置,当临时授权过期后,用户可联系新数科技延长试用或购买,并将新授权码在此配置项中添加:

   

   

总结

   

新云监控基于团队多年的数据库研发和服务实践经验,并不断依据客户的实际需求和使用反馈进行了多次改版,打造成为在DB2方面最为专业的数据库监控、运维和调优软件。通过新云监控,即便只有基本数据库基础的工程师也能对DB2很快了解并掌握,新云监控也提供了大量关键指标并记录历史信息,使得以往极为复杂高难度的数据库调优工作变得极为便捷,大量的图表展示也让数据库相关运维工作可视化可度量化,关键的实时监控最大程度保障数据安全。另外新数科技基于新云监控提供“新数云服务”,创新性地帮助客户提升工作效率,降低TCO,并可依据客户的实际需求和使用环境定制化开发。

参与1

0同行回答

“答”则兼济天下,请您为题主分忧!

提问者

新数科技
IT顾问北京新数科技有限公司

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2016-01-05
  • 关注会员:1 人
  • 问题浏览:1763
  • X社区推广