leadcom
作者leadcom·2010-09-29 13:59
经理·广东村村通科技有限公司

HP服务器的一些故障示例及可能的解决方案

字数 3617阅读 2610评论 0赞 2

系统无法上电

第 1 步. 回顾服务器的安装过程。请参考第 3 章“安装和配置”。

第 2 步. 检查所有电源连接电缆。

第 3 步. 验证交流电源插座中是否有电。请用另一设备检查插座的电源输出。

第 4 步. 检查电源风扇是否正常运行。这些风扇是以电源产生的直流电压为动力运转的。

第 5 步. 检查主板上 SCSI 接口旁的 STBY (电源良好) LED 是否点亮。

第 6 步. 检查从电源到配电模块的所有连接。

第 7 步. 验证所有的电缆和模块是否都正确连接。尤其是要检查显示面板的连接。

第 8 步. 如果系统先加电然后又掉电,则可能是电源的电压值不符合规格。BMC 将监视电压,并在电压值不符合规格的情况下阻止加电。

系统无法引导

第 1 步. 检查显示面板的 LED,看是否有警告或故障指示。如果有警告指示,则系统 LED 将呈黄色闪烁,如果有故障指示则呈红色闪烁。

第 2 步. 检查四个诊断 LED,看是否有特定的警告指示或故障指示。诊断 LED 提供的模式可以将警告或故障源分类。

第 3 步. 显示并检查 SEL 和 FPL 以获得与警告或故障指示相关的深入信息。

第 4 步. 查看所有固件的修订版。

第 5 步. 使用 BMC 的 cli 来循环电源:cli>pc off、cli>pc on。

第 6 步. 关闭服务器,等待二十秒钟以上,然后再次打开服务器以查看故障是否清除。

第 7 步. 检查所有的 DDR DIMM 是否正确插入。

第 8 步. 检查主板上的 DDR DIMM 配置与允许的配置是否相符。必须至少安装一对 DDR DIMM。

第 9 步. 验证 DIMM 是否完全插入。如果 DIMM 完全插入了装配接口,则固定栓锁将闭合(它们将与 DIMM

的前端持平)。如果栓锁未闭合,请将它们啮合并完全闭合,将 DIMM 重新完全插入。

第 10 步. 检查处理器是否安装在正确的插槽中,以及每个处理器是否都安装了电源盒。另外还应验证各处理器是否类型相同。

第 11 步. 使用 SCSI 配置实用程序检查引导顺序。

第 12 步. 如果有明显错误,则请刷新固件。 请参考《HP Integrity rx1620 Operations Guide》中的“Utilities”一章。

第 13 步. 如果系统仍然无法引导,则可能需要更换基本部件。

系统出现间歇性故障

第 1 步. 检查显示面板的 LED,看是否有警告或故障指示。如果有警告指示,则系统 LED 将呈黄色闪烁,如果有故障指示则呈红色闪烁。

第 2 步. 检查四个诊断 LED,看是否有特定的警告指示或故障指示。诊断 LED 提供的模式可以将警告或故障源分类。

第 3 步. 显示并检查 SEL 和 FPL 以获得与警告或故障指示相关的深入信息。

第 4 步. 确认系统风扇配件是否已完全插入。

第 5 步. 验证服务器插入的电源是否符合电源的标签上所述的规格。

第 6 步. 确认内置的 SCSI 链是否已端接,且该端接未被任何驱动器所启用。请注意,LVD SCSI 的端接在电缆上提供。

第 7 步. 检查处理器是否安装在正确的插槽中,以及所有未使用的插槽中是否都装入了终结器。

第 8 步. 重新插入所有主存 DDR DIMM。

第 9 步. 如果清除了日期和时间,或者客户设置,则需要更换主板电池。

系统 LED 或诊断 LED 不亮,但没有出现错误消息.

如果服务器不工作,且没有任何 LED 点亮,也没有出现错误消息,请检查下列内容:

第 1 步. 确认所有的电缆和交流电源线是否都插到了各自正确的插座中。

第 2 步. 确认交流电源插座是否正常。如果服务器插到了开关式多电源插座盒中,请确认插座盒中的开关是否已打开。

第 3 步. 确认服务器是否已打开(电源接通指示灯变绿且风扇打开)。

第 4 步. 关闭服务器,等待二十秒钟以上,然后再次打开服务器以查看故障是否清除。

第 5 步. 确认所有的板是否都安装正确,且处理器安装在正确的插槽中。它们都必须牢固地插在各自的插槽中,并且电缆也必须连接牢固。

第 6 步. 如果在插入某个新板后服务器停止工作,请卸下该板并再次打开服务器。如果这样服务器即可工作,则请查看新板随附的安装说明,以获取正确的安装方法。如果新板使服务器无法上电,则可能存在严重的电子故障。

第 7 步. 如果服务器仍然无法工作,卸下已安装的所有的板和选件(不要卸下硬盘驱动器),然后打开服务器。

第 8 步. 依次添加板和选件(一次一个),以确定到底是谁引起了故障。

第 9 步. 如果添加过内存,确认 DDR DIMM 是否正确地插入了主板。另外还要检查 DDR DIMM 配置,看 DDR

DIMM 是否成对。

服务器掉电后无法再次加电

如果出现了某些严重情况,服务器会关闭所有的电源。

可能关闭服务器的严重情况有:

•剧烈的温度变化

•电压故障(外部交流电线路)

•电源故障

如果服务器掉电,在重新启动服务器之前,请执行下列操作:

第 1 步. 检查显示面板的 LED,看是否有警告或故障指示。如果有警告指示,则系统 LED 将呈黄色闪烁,如果有故障指示则呈红色闪烁。

第 2 步. 检查四个诊断 LED,看是否有特定的警告指示或故障指示。诊断 LED 提供的模式可以将警告或故障源分类。

第 3 步. 显示并检查 SEL 和 FPL 以获得与警告或故障指示相关的深入信息。

第 4 步. 首先检查电源是否可以通到服务器上。将已知可以正常工作的设备插入电源插座。

第 5 步. 检查服务器是否能正确通风。如果是安装在机架中,则服务器的前后两端必须至少有三英寸的空间才能正常通风。

第 6 步. 检查系统的规格,确认环境温度和电压是否符合指定的范围。

第 7 步. 监视系统,确认没有发生更严重的温度和电压问题。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

2

添加新评论0 条评论

Ctrl+Enter 发表

作者其他文章

X社区推广