我们搭建了datastage集群,并配置了多个节点。时常遇到作业报错,导致日终程序停滞。
报错信息显示如下:
The section leader on **** died
***Parallel startup failed ***
**********************
Unable to contact one or more Section Leaders.
作业就 aborted 了。一般情况下,只要再重复执行一次便能顺利完成了。
疑问:
datastage集群是用一个配置文件管理节点信息,如果配置文件中的某个节点出现异常,集群就无法执行“并行作业”了吗?(目前暂未发现异常节点所在服务器存在问题)
是否哪里配置有问题?或者有无解决方案,避免这种错误的发生?