诊断分析
Diagnostic Logsequence number: 12938
Resource tested: sysplanar0
ResourceDescription: 系统平面
Location:
SRC: B123E504
Description: Memory subsystem including externalcache Predictive
Error, general. Referto the system service
documentation for moreinformation.
Additional Words: 2-030000F0 3-2B3E0110 4-C13920FF5-410000FF
6-00812B42 7-000003038-0BBB0001 9-65020EFF
Possible FRUs:
Priority: H FRU: 77P7504 S/N: n/a CCIN: 31A8
Location: U78A0.001.DNWK6H8-P1-C14-C7
Priority: H FRU: 77P7504 S/N: n/a CCIN: 31A8
Location: U78A0.001.DNWK6H8-P1-C14-C2
Priority: H FRU: 77P7504 S/N: n/a CCIN: 31A8
Location: U78A0.001.DNWK6H8-P1-C14-C9
Priority: H FRU: 77P7504 S/N: n/a CCIN: 31A8
Location: U78A0.001.DNWK6H8-P1-C14-C4
第一次更换,ASMI清除硬件报错信息,把4条内存更换了,起机,发现C14-C7、C14-C2、C14-C9内存已正常,但C14-C4槽位的内存仍然无法识别。
怀疑新的4条新内存里有一条内存DOA
第二次更换,ASMI清除硬件报错信息,把其他槽位正常的一条内存,与C14-C4槽位的内存调转,起机,发现仍然是C14-C4槽位的内存仍然无法识别。
消除内存是DOA的疑点,怀疑模块插槽C4有问题
第三次更换,ASMI清除硬件报错信息,把C14-2/4/7/9内存调换到另外4个插槽,起机失败。
仍然怀疑插槽C4有问题,但不排除C14这个CPU模块板有问题
第四次更换,ASMI清除硬件报错信息,把两个CPU模块C13与C14整体调换,起机,发现C13-C4槽位的内存无法识别。
所以确认此CPU模块板有问题。
重新尝试更换CPU模块板
但尝试几个方式(包括调内存、调模块)更换后,问题仍然存在
因一条内存导致整组内存DECONFIG。
机器还是能正常运行,内存少了一半。
现在毫无头绪了,会是主板坏了吗?请给位帮忙一下
收起