老将终抵不过岁月的摧残(P550设备宕机更换主板后不能正常启动)

前几天一台系统运行了1300多天未宕机,未重启,设备快10年的9113-550 设备宕机了(默哀30秒)

123.gif


ASMI里报

c8c9.jpg


更换P1-C8、P1-C9槽位CPU之后设备、系统正常启动


一周过后设备又宕机了

怀疑是主板故障了(一般同时坏两个CPU也不正常),更换了主板,更换后设备无法加电

ASMI里只报:

c9.jpg


怀疑是C9  CPU故障(此时设备无法加电)


由于C9为core cpu

然后我们将C8与C9调换位置后加电报如下错误:


c8.jpg


应该是这个CPU板出问题了

设备也无法加电。


后面尝试单CPU启动设备,拔掉了C8槽位的CPU。

设备加电 过一会儿之后设备自动Power off

asmi报如下两个错误:

1.jpg


2.jpg


3.jpg


查了手册11001511的意思应该是电源的问题。

问题1:这能确认是电源还是主板的问题吗?

问题2:单CPU启动这样做可行吗?(有两个CPU板)

问题3:问了大牛说也有可能是CPU vrm电源模块的问题

问题4:和主板的firmware关系大吗?

希望大家多多给出宝贵意见。小生在此谢过!

参与32

11同行回答

byamingbyaming  小型机/X86服务器/常见品牌存储硬件运维 , NONE
这种机型是可以单U启机,但是你的现场估计没有所需的东西,保留CPU1,拆了CPU2,拔掉2的VRM,然后插上PROCESSOR FILLER CARD。你说的几种可能都是有可能的,先更换报错的那个CPU吧,你下面11001511很有可能是不规范的单U启机操作而造成的,我只是猜测。...显示全部

这种机型是可以单U启机,但是你的现场估计没有所需的东西,保留CPU1,拆了CPU2,拔掉2的VRM,然后插上PROCESSOR FILLER CARD。

你说的几种可能都是有可能的,先更换报错的那个CPU吧,你下面11001511很有可能是不规范的单U启机操作而造成的,我只是猜测。

收起
IT其它 · 2017-02-25
浏览4979
byamingbyaming  小型机/X86服务器/常见品牌存储硬件运维 , NONE
这种机型,单CPU启动需要加个堵头(PROCESSOR FILLER CARD),你看看CPU2的位置,插槽旁边是不是有个小接口。还想继续用如果确认是U坏了就直接换吧,现在淘宝大把而且便宜。其实550 55A还好,现在说不定还大把像H70、630在某些机房继续奉献这自己。网上找图都找不到,找了个拍给你看。...显示全部

这种机型,单CPU启动需要加个堵头(PROCESSOR FILLER CARD),你看看CPU2的位置,插槽旁边是不是有个小接口。还想继续用如果确认是U坏了就直接换吧,现在淘宝大把而且便宜。

其实550 55A还好,现在说不定还大把像H70、630在某些机房继续奉献这自己。


网上找图都找不到,找了个拍给你看。

QQ截图20170225115705.png


QQ截图20170225115650.png


QQ截图20170225115628.png


收起
IT其它 · 2017-02-25
浏览4738
yhsihyhsih  系统运维工程师 , 某网络公司
建议别折腾了,纯粹浪费时间。这种机器早就该淘汰了,继续使用成本非常的高,风险非常大。赶快打报告买新机器,调用售后服务商的备机把系统启动起来后做系统迁移到新的服务器上去显示全部

建议别折腾了,纯粹浪费时间。这种机器早就该淘汰了,继续使用成本非常的高,风险非常大。赶快打报告买新机器,调用售后服务商的备机把系统启动起来后做系统迁移到新的服务器上去

收起
零售/批发 · 2017-02-25
浏览4633
sugosugo  系统运维工程师 , 上海浦东中软科技发展有限公司
550的机器CPU有bug的,当年坏了多少CPU啊显示全部

550的机器CPU有bug的,当年坏了多少CPU啊

收起
政府机关 · 2017-03-05
浏览3642
bjhonglilaibjhonglilai  销售代表 , 北京宏利莱科技发展有限公司
CPU和主板同时坏的可能性比较小,550这款机器CPU散热设计有缺陷,你可以看下CPU底部的针脚已经烧变形了。显示全部

CPU和主板同时坏的可能性比较小,550这款机器CPU散热设计有缺陷,你可以看下CPU底部的针脚已经烧变形了。

收起
IT分销/经销 · 2017-03-02
浏览5170
zx2100933zx2100933  系统工程师 , holystone
确实如byaming兄所说,单CPU启动需要加个堵头(PROCESSOR FILLER CARD),找了台报废机找到了这个堵头,机器正常启动了。  但起来后i/o槽P1-C4有报错了,换卡后还是不行. 哎!还的换个主板。...显示全部

确实如byaming兄所说,单CPU启动需要加个堵头(PROCESSOR FILLER CARD),找了台报废机找到了这个堵头,机器正常启动了。  但起来后i/o槽P1-C4有报错了,换卡后还是不行. 哎!还的换个主板。

收起
系统集成 · 2017-03-02
浏览4857
marslummmarslumm  系统工程师 , CIT
550的CPU在我看来和当年F85的电源一样,是最不可靠的备件之一,更何况停产这么多年了。记得几年前修一台宕机的550,换到第五个CPU板才稳定下来……显示全部

550的CPU在我看来和当年F85的电源一样,是最不可靠的备件之一,更何况停产这么多年了。记得几年前修一台宕机的550,换到第五个CPU板才稳定下来……

收起
系统集成 · 2017-03-02
浏览4673
AcdanteAcdante  技术总监 , SHFY
题主可真是尽心尽力了。不过如上byaming所说,你这550单CPU启动需要插上PROCESSOR FILLER CARD。你这Power的报错,很有可能是未正常开机造成的.另外:我这有个参考:   之前也遇到过一台P720宕机,报错有主板,有CPU VRM 稳压模块,也有Firmware。由于之前一直都是正常的,所...显示全部

题主可真是尽心尽力了。

不过如上byaming所说,你这550单CPU启动需要插上PROCESSOR FILLER CARD。你这Power的报错,很有可能是未正常开机造成的.

另外:我这有个参考:

   之前也遇到过一台P720宕机,报错有主板,有CPU VRM 稳压模块,也有Firmware。由于之前一直都是正常的,所以,就先进行了替换法,发现可以正常启动(同题主),过了不久,又宕机,伴随着Firmware报错和之前一样的报错,CPU。这次直接就进行了微码升级,并未升级至最新版本。微码升级完成后,慢启,报错消失,机子正常启动。运行至此也未再出现过问题。

这只是参考,如果题主还愿意折腾,P550还需要使用的话,可以考虑先升级微码。或者直接更换CPU。

收起
互联网服务 · 2017-03-01
浏览4762
myciciymyciciy  IT顾问 , 某金融科技公司
岁月是把杀猪刀,P550基本上完成了使命。不过还好IBM宕机对于厂商来讲讲定位很简单,工具资料很多。维护厂商还是靠摸索和经验积累,由于IBM机型产品特点,很多经验都可以通用。显示全部

岁月是把杀猪刀,P550基本上完成了使命。不过还好IBM宕机对于厂商来讲讲定位很简单,工具资料很多。维护厂商还是靠摸索和经验积累,由于IBM机型产品特点,很多经验都可以通用。

收起
银行 · 2017-03-01
浏览4670
cwnlinuxcwnlinux  系统工程师 , CCSU
P550这个机器我一般都是带一个CPU、一个VRM、一个CPU终结器、一个主板。这个机器问题太多了。显示全部

P550这个机器我一般都是带一个CPU、一个VRM、一个CPU终结器、一个主板。这个机器问题太多了。

收起
互联网服务 · 2017-02-26
浏览4785

提问者

zx2100933
系统工程师holystone
擅长领域: 服务器AIXUnix

问题来自

相关问题

相关资料

问题状态

  • 发布时间:2017-02-24
  • 关注会员:12 人
  • 问题浏览:16082
  • 最近回答:2017-03-05
  • X社区推广