TSM备份Oracle数据库,偶尔会报:ANS1301E(RC1)This operation cannot continue due to an error on the TSM Server. See your TSM server administrator for assistance。
收起一般是超时导致的,如果是数据库备份,增量备份容易出现。如果是增量备份,建议开启block change tracking,会环境增量内容的计算时间。
有两个超时设置
1. 是tsm层面的,设置idletimeout x,单位是分钟
2. 是os的tcp协议栈层面的,超时可能会被网络中 安全设备中断连接,参数如下
net.ipv4.tcp_keepalive_time = 7200
net.ipv4.tcp_keepalive_intvl = 75
net.ipv4.tcp_keepalive_probes = 9
解释:
tcp_keepalive_time=7200:2小时内如果没有任何连接活动,启用keepalive机制
tcp_keepalive_intvl = 75:每75秒检测一次
tcp_keepalive_probes = 9:如果连续检测9次都没活动连接,则中断此连接
系统发现死亡连接的时间:tcp_keepalive_time+(tcp_keepalive_intvl*tcp_keepalive_probes)
按默认来算:7200+(75*9)=7875s=2小时11分11秒 系统2小时11分11秒才能发现死亡连接
所以,可以尝试下把这3个值该小,看看有没有效果,比如下面 大概15分钟发现死亡连接
net.ipv4.tcp_keepalive_time = 700
net.ipv4.tcp_keepalive_intvl = 10
net.ipv4.tcp_keepalive_probes = 20