硬件生产aix 6

p6-550内存问题

诊断分析Diagnostic Logsequence number: 12938Resource tested:        sysplanar0ResourceDescription:   系统平面Location:               SRC:     &nb...显示全部
诊断分析
Diagnostic Logsequence number: 12938
Resource tested:        sysplanar0
ResourceDescription:   系统平面
Location:               
SRC:                    B123E504
Description:            Memory subsystem including externalcache Predictive
                        Error, general. Referto the system service
                        documentation for moreinformation.
Additional Words:       2-030000F0 3-2B3E0110 4-C13920FF5-410000FF
                        6-00812B42 7-000003038-0BBB0001 9-65020EFF
Possible FRUs:
    Priority: H FRU: 77P7504  S/N: n/a          CCIN: 31A8
    Location: U78A0.001.DNWK6H8-P1-C14-C7
    Priority: H FRU: 77P7504  S/N: n/a          CCIN: 31A8
    Location: U78A0.001.DNWK6H8-P1-C14-C2
    Priority: H FRU: 77P7504  S/N: n/a          CCIN: 31A8
    Location: U78A0.001.DNWK6H8-P1-C14-C9
    Priority: H FRU: 77P7504  S/N: n/a          CCIN: 31A8
    Location: U78A0.001.DNWK6H8-P1-C14-C4

第一次更换,ASMI清除硬件报错信息,把4条内存更换了,起机,发现C14-C7、C14-C2、C14-C9内存已正常,但C14-C4槽位的内存仍然无法识别。
怀疑新的4条新内存里有一条内存DOA


第二次更换,ASMI清除硬件报错信息,把其他槽位正常的一条内存,与C14-C4槽位的内存调转,起机,发现仍然是C14-C4槽位的内存仍然无法识别。
消除内存是DOA的疑点,怀疑模块插槽C4有问题


第三次更换,ASMI清除硬件报错信息,把C14-2/4/7/9内存调换到另外4个插槽,起机失败。
仍然怀疑插槽C4有问题,但不排除C14这个CPU模块板有问题


第四次更换,ASMI清除硬件报错信息,把两个CPU模块C13与C14整体调换,起机,发现C13-C4槽位的内存无法识别。
所以确认此CPU模块板有问题。


重新尝试更换CPU模块板
但尝试几个方式(包括调内存、调模块)更换后,问题仍然存在

QQ图片20150515222427.jpg



因一条内存导致整组内存DECONFIG。

机器还是能正常运行,内存少了一半。


现在毫无头绪了,会是主板坏了吗?请给位帮忙一下

收起
参与8

查看其它 6 个回答yanliang1989的回答

yanliang1989yanliang1989系统工程师IBM
1.一开始就应该只更换C14-C4,而不是4条内存
2.第三次更换,ASMI清除硬件报错信息,把C14-2/4/7/9内存调换到另外4个插槽,起机失败
---->你这个肯定是会failed,你要清楚P6-550内存规则,你必须先插满第一个quads,才能插第二个quads
3.严重质疑你是否用celogin1用清除过deconfig信息
celogin1登录ASMI,然后clear All deconfigure
系统集成 · 2015-05-16
浏览2973

回答者

yanliang1989
系统工程师IBM
擅长领域: 服务器系统管理AIX

yanliang1989 最近回答过的问题

回答状态

  • 发布时间:2015-05-16
  • 关注会员:1 人
  • 回答浏览:2973
  • X社区推广