聂奎甲
作者聂奎甲2017-07-24 10:54
项目经理, 长春长信华天

TSM部署难点及运维中故障诊断、处理探讨总结

字数 3313阅读 4298评论 1赞 9

为了保证数据的安全性和业务的连续性,各个企事业单位都非常重视数据的备份工作。

IBM Tivoli Storage Manager简称TSM,TSM能够为用户提供企业级存储数据管理的全面解决方案,包括集中的数据备份与恢复管理、专业的数据归档管理功能、高级的分级存储功能和流程化的灾难恢复管理。

通过使用Tsm可以为生产系统的数据做备份,当生产数据因各种原因损坏后还有可用的备份数据进行数据恢复,从而提高了数据的安全性和保证了业务系统的连续性。为了让大家对TSM的部署以及运维有更深入的理解,社区组织了这次活动,在此邀请大家积极参与共同交流学习提高。

如何保证TSM服务器端与客户端的正常运行?

1,注意定期对tsm服务器和客户端的巡检,及时发现问题并处理。
2,定期检查tsm备份是否成功,如果备份失败查清原因并处理。
3,定期做好备份数据的恢复演练,保证tsm备份成功的数据是可用的。
4,配合自动化启停脚本完成TSM系统的监控。

如何做到TSM系统的自动运维?

1,可以考虑使用crontab或调度完成备份,配合脚本完成日常检查,比如邮件等功能,可以结合监控软件如bmc或zabbix完成物理硬件和应用可用性监控,当然可以配合商业产品完成漂亮的图表等查询功能。
2,把TSM的运维做好的话,每天的人工巡检是一部分工作之外,可以考虑投入一部分资金基于TSM平台进行一些开发,因为TSM有这样的接口,比如调度执行结果,尤其是TSM调用脚本执行的结果,日志在本地生成,可以考虑通过Agent采集的方式把日志收集上来;比如数据量监测,每天的数据量都维持在一个平稳的数值,如果某一天数据量上来了,应该关注一下。应该有一些工作在做这方面的定制化。

TSM系统部署流程是怎样的?需要做好哪些准备工作?

1,备份系统的整体规划,包括存储架构,主机的部署,备份方案的确定。
2,tsm系统的安装配置,初始化。
3,备份服务器的配置,策略域的设置,存储池等。
4,客户端的实施,安装tsm软件包并配置。
5,备份恢复测试。
TSM系统在首次部署时关注点有哪些?
1,你需要知道你要备份的是数据库还是操作系统,决定了你要选用的tsm模块
2,备份的数据量有多大,能否在规定的时间窗口内完成备份
3,为了在规定的时间窗口内完成备份,对磁带库有哪些要求
4,如果有同城备份选用什么传输线路?带宽具体多少能满足要求,这些都需要考虑
5,未来数据量增长的趋势,尽量建成备份系统后,满足未来1~3年的数据增长需求

TSM系统常见的故障有哪些,如何处理这些故障?

1,RC 106,一般是日志权限的问题,找到需要的日志,加上权限。
2,RC 12,介质mount不可用,一般是TSM调用带库的时候出现问题,查查驱动器和path,看看存储池的最大可用scratch数值;如果是磁盘,看看磁盘的文件系统权限。
3,第一次启动调度的时候,如果调度进程未启动,可能是因为password生成参数没设置好,或者没有手动的登录一下客户端。
4,ANS0102W,语言包的问题导致dsmc登录不了,将/opt/tivoli/tsm/client/lang/en_US目录内所有内容,拷贝到/opt/tivoli/tsm/client/ba/bin目录下试试。
5,ORA-19554,动态链接库的问题可能大些。
6,根据具体问题具体分析。

TSM备份失败后,如何查询失败的原因?

1,一般如果文件备份的话,Unix平台,调度执行失败之后在dsm.sys中你会指定调度日志,按照指定的日志,里面会记录哪些文件备份失败,因为什么失败,是路径不存在还是文件正在用。
2,如果是数据库备份的话,Oracle会有生成的rman日志,DB2和SQL可能没有那么详细的日志,你可以查询一下备份时间段的活动日志,活动日志中也会记录一些有用的信息和错误代码。通过因为调用了API,所以一般也会有API错误日志,比如dsierror.log,dsmerror.log这样的日志。
3,重点关注以下日志,数据库日志:api的log,tsmserver的log;文件日志:ba的log,tsmserver的log。

分享:为什么要选择TSM?TSM相对于其它备份软件的优势。

1 TSM对数据的分级存储能力提供给了用户按照数据价值来匹配存储成本的能力。
2 TSM对数据的分级存储能力提供给了用户将被管数据在存储介质间,包括向新技术存储介质间自由转移的能力。这就避免了用户必须手工的将数据转移到新技术或者必须保留在旧技术范围内的局面。
3 TSM 的综合磁盘支持功能使数据每晚快速备份到磁盘,然后自动在非高峰的时间转移到磁带上面去,从而提供给客户一个不需要太多的磁带驱动器、能够更快的完成备份、以及提供健壮的磁盘存储池支持能力的解决方案。
4 TSM的健全的磁盘支持功能提供了对多卷标、甚至可能在不同文件空间上的多卷标到一个大虚拟存储池的整合。这就更好的利用了磁盘空间,使更大、更多的文件存储于磁盘之上,并能自动根据存储空间阀值将数据转移到其他类型的存储池。
5 TSM策略驱动的数据自动迁移功能可以将数据从一种介质转移到另外一种介质。这确保了数据的信息生命周期管理,在数据的整个生命周期里,通过将数据存储于与其价值相匹配的介质上可以为用户节约资金。
6 TSM 的自动回收能力减少了存储被管数据所需要的介质数量,节约了用户的存储资金,加速了数据恢复的时间。自动回收是一个策略驱动的自动步骤,它选出因为过期文件或者已删除文件而造成有一定百分比的空区的磁带,将该磁带上仍存有的有效数据转移到另外的磁带上面,从而释放了那些部分为空的磁带以供更好的使用。
7 TSM 的永久增量备份功能可加快备份的速度,节约存储介质以及降低网络流量。永久增量备份仅备份新的和改动过的文件。这种智能备份不依赖于旧的备份方式(full+incremental), TSM可以对单个文件的状况进行追踪,因此可以通过使用这种更加精确的备份方法来为客户节约时间、空间和金钱。
8 TSM完整的灾难恢复计划工具针对一个完整的信息数据中心需要恢复时应该怎么去做、提供了最新的、逐步的指导。它通过帮助客户保持商业的连续性来为客户节约时间和金钱。
9 TSM的存档功能可按照策略指定的时间在删除前追踪这些文件。这种基于时间的文件保持方法是一种理想的数据保存方式。
10 TSM开放API(应用软件接口),允许第3方产品、用户、和其他的IBM产品使用TSM的数据管理功能,从而扩展了数据管理功能的利用率和范围,也提升了产品的投资回报率。
11 TSM独一无二的关系数据库架构使它能提供其他竞争者不能提供的强劲功能和特点(比如永久增量备份,回收,迁移,开放API等)来管理数据,因此对客户来说这是一个更加灵活的、功能更丰富的产品。
12 TSM的出众的性能通过第三方的标准测试显示:和VeritasNetBackup 相比,仅需要40% 的备份周期, 87% 的备份速度提升和44% 的磁盘空间要求。
13 TSM的可回溯的更新策略功能使用户对数据管理策略做出的改动能够应用到已经被处理过的数据。这意味着用户不需要对数据进行重新备份、归档、和HSM。
14 TSM内置的移动备份功能对于远程用户和使用低速网络连接的用户来说是一个理想的备份解决方案。它通过仅备份byte级别或者block级别的变化来实现更经济的永久增量备份。
15 TSM的运维报告功能将存储管理操作和可能事件预警的摘要直接送交管理员。这个功能节约了管理员的时间、提高了他们响应突出事件的效率。
16 TSM的备份集功能可以在不使用备份服务器的情况下直接快速的备份数据。对于在灾难后或者无网络连接到存储服务器的时需要快速恢复的用户来说这是一个卓越的方式。
17 TSM基于日志的备份功能以不需要扫描文件系统来更进一步的缩短备份时间为特色。这种备份方式仅仅通过查看日志就能发现那些文件被改动过。这就使备份更加快捷同时也较少的占用cpu时间。
18 TSM的精确恢复功能能够精确的找回你所需版本的文件,而不用恢复旧版本的文件,也不会恢复已经删除的文件。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

9

添加新评论1 条评论

#penguin23系统运维工程师, 广州佳杰科技有限公司
2017-07-29 17:04
赞赞赞!TSM备份架构,还有哪些企业在用呐~也很久没搞TSM了
Ctrl+Enter 发表

本文隶属于专栏

活动总结
活动总结是社区交流活动内容的总结及延伸,为大家提供了社区专家们丰富且高水平的理论知识、实践经验以及常见问题的最佳解决方法,非常值得大家收藏学习。

关于TWT  使用指南  社区专家合作  厂商入驻社区  企业招聘  投诉建议  版权与免责声明  联系我们
© 2019  talkwithtrend — talk with trend,talk with technologist 京ICP备09031017号-30