aix7
作者aix7·2018-03-30 08:26
项目经理·长春龙泰科技有限公司

IBM、LENOVO、DELL等x86服务器运维难点与故障处理在线探讨总结

字数 3415阅读 6208评论 1赞 10

IBM、LENOVO、DELL等x86服务器运维难点与故障处理在线探讨总结
X86应该算是我们广为熟知的架构了,由于X86服务器和台式机有着很多相似之处,从前期部署到中期维护到后期管理都有着异曲同工之妙。用得多了,遇到的故障自然不少,以下故障不知大家是否遇到过……
说起X86平台的CPU,我们可能会如数家珍的报出N多种,Inter的至强5600、至强7500,AMD强劲的12核心x86处理器--“Magny-Cours”(马尼库尔)等等。在它的基础上,辅以带ECC、ChipKill、热插拔技术的内存;防止数据异常丢失的RAID硬盘;提供不中断电力供应的冗余电源等等共同构建出一个完整的X86服务器。
本次交流活动将从以下几个方面剖析x86服务器运维难点与故障处理包括网卡、风扇、电源、cpu、内存、硬盘、raid、主板、静电、不明原因的故障。

一.服务器常见问题汇总

服务器一般是很少出现问题的,一旦出现问题,怎样去积极的抢救呢?我们不能坐以待毙,原因一旦服务器故障,那么该服务器上的所有网站将都会无法打开。对于一个企业来说,网站就是他们的命脉,损失是巨大的
服务器支撑着整个企业的信息数据,对公司的信息储存、业务开展、正常运作等等环节都具有着至关重要的意义。然而,服务器在日常运行过程中,由于其复杂的硬件结构、繁琐的运行原理,经常会出现一些大大小小的问题困扰着各位。下面精心整理一些服务器的常见问题汇总,帮助各位排忧解难。

1.系统蓝屏、频繁死机、重启、反映速度迟钝

服务器的与我们平常电脑不论是硬件结构还是运行系统,都是极其类似的。因此,就如同我们的电脑一样,一样可能会感染病毒,同样会因为系统漏洞、软件冲突、硬件故障导致死机、蓝屏、重启等故障,同样会因为垃圾缓存信息过多而导致反应迟钝。

2.远程桌面连接超出最大连接数

由于服务器默认为允许连接数为2个,如果登陆后忘记注销,而是直接关闭远程桌面的话,服务器识别此次登陆还是留在服务器端的。出现这种情况,最常见的就是重启服务器,但是,如果是高峰期,重启服务器带来的损失是显而易见的。那么此时,就可以利用mstsc/console指令进行强行登陆了。打开“运行”框,键入“mstsc/v:xxx.xxx.xxx.xxx(服务器IP)/console”,即可强行登陆到远程桌面了。

3.无法删除的文件该怎么清理

遇到这种情况,可能是该文件还在运行中,可以重启删之,或者运行CMD,输入arrtib-a-s-h-r想要删除的文件夹名,最后输入del想要删除的文件夹名即可删除,运行该命令后无法恢复,请慎用。

4.系统端口隐患

对于服务器来说,首要保障稳定性和安全性。因此,我们仅需保证服务器最基本的功能即可,就像声卡都是默认禁止的。我们并不需要太多的功能,也不需要太多的端口支持。像一些不必要,而且风险较高的端口大可封掉。而一些必要的,又有风险的端口,比如:3389、80等端口,我们可以通过修改注册表的方法将其设置不特殊的秘密端口,这样服务器端口的安全隐患就不复存在了。

二.IBM 3650M3服务器外接220V意外断电后,再来电,服务器无法启动,如何处理?

按以下步骤处理:
查看服务器是否有桔色灯,按桔色类指示检查硬件,检查电源工作是否正常,有AC,没有DC是有电源有输入没有输出。启动键不亮,是主板没有加电。IMM应该不通,无法查看IMM日志。不加电的故障,首先判断电源是好是坏,最好用的方法是短接电源黑绿插头,风扇能转动起来,电源多数是好的。相反,更换电源即可。若判断电源能正常工作,那就在机箱内拔掉各种板卡做最小化测试,要是有加电反映,那就是板卡导致的,要是仍无加电反映,那就更换主板。

三.IBM 3650M4服务器硬盘更换流程,两块330g硬盘做的raid1,另一块硬盘600g硬盘没有做raid1,600g硬盘损坏后如何更换?

正常情况下把坏硬盘移除插入新硬盘就可以了,如果操作系统无法识别到硬盘就需要重启动服务器进入webbios中重新激活新硬盘后,操作系统才能正常使用硬盘。
2块300GB 做RAID1,损坏一块直接更换即可。
如果另外一块600GB硬盘就单盘使用,已经故障的话,系统内已经无法识别这块盘了,数据也没有了。更换后,如果无法识别,需要进RAID Web配置界面进行初始化配置。
另外:不建议单块盘直接使用,无数据保护。

四.lenovo 万全服务器,用户反应最近几天办理业务时速度很慢,经常卡住没反应,经查应用系统没有问题,如何处理?

首先检查办理业务速度慢的是个别用户,还是所有用户,如果是所有用户都慢,需要进看服务器的cpu和内存占用率是否很高、之后查看网卡工作状态是否正常。
网络,应用,中间件,数据库,操作系统,服务器,存储都会涉及到,要做综合分析。先从系统层面着手,看看有没有异常进程,资源使用率是否合理,IO是否有瓶颈,网络是否有丢包,连接数是否正常.....逐步排查,向外扩展排查范围。

五.dell服务器报W1228 ROMB Batt < 24hr错误如何处理?

这个报警是阵列卡的电池容量如果在停电的状态下无法使用超过24小时,也就是电池寿命将要完结,这个报警不会影响操作系统运行,即使电池故障也不会影响操作系统,只是在阵列卡上的缓存将被禁用而性能上有所影响,建议您如果服务器在保修期内请致电商家进行报修。

六.更换阵列卡后如何加载驱动?

原来用的是raid1,两块146G的盘现在要加一个raid5的阵列卡,原先的阵列卡不支持raid5所以只能更换新的阵列卡,但是直接用新的阵列卡连接原来的raid1阵列,系统蓝屏重启请教一下如果在不重新做系统的情况下加载新的阵列卡驱动到系统?因为原系统上面有一套单独购买的录音程序原来的开发公司迁移程序是要费用的。
一般raid1要实现更高级别的阵列扩容,那么首先raid1要支持raid5,即本身两块盘在独立的阵列卡支持raid5、raid1的情况下创建的raid1,那么这种情况下,只需要加一个电池保护就可以实现raid1至raid5的扩容。就你所说的这种情况,两块盘如果不打算加至三块或者三块以上做raid5的话,建议你还是保持原环境,否则出现蓝屏诸如0x0000007B的报错很正常,而且阵列会乱数据有风险。【提醒:切不可在不做任何备份的情况下,直接更换其他不同型号的阵列卡并开机启动,此类操作很有风险】

七.IBM X3650M3机器重装系统问题?

一台3650安装系统,之前安装linux系统。现在要更换成2003系统,我在ibm官网上下载了serversguide引导盘,通过用引导盘去安装,引导盘启动很正常,按照启动提示一直做,没有任何报错,但是通过引导盘做完后,重启进入系统居然提示“boot fault”,难道是引导盘的问题,又去下了个9.0的版本,结果还是一样,也没有安装完成。当时都不找到是什么问题,raid也是正常的,硬盘也没有问题
通过用软件将raid驱动和硬件驱动集成到2003iso镜像后,然后在去安装系统,就可以正常进入系统,实在不行硬件驱动也可以单独安装,raid驱动要集成到2003iso镜像中。

八.Lenovo x3650m4服务器更换主板后,无法进入系统,请问如何处理?

针对 2008R2、linux6 以上版本更换主板后无法启动
带图片的完整内容的连接
http://www.talkwithtrend.com/Document/detail/tid/414491
由于机器故障不得不更换主板,这样主板上的启动项就会随着老主板一起报废开机后找不到
启动项无法进入系统。
新更换的主板没有操作系统的启动项。
进入 RAID 看 raid 信息是否完整。
退出进入到 boot manager。这里面可以修改、添加、删除启动项。
选择增加启动项。
在下面会看到一个没有卷标的启动项,不用怀疑就是他了。直接回车
对比如果阵列卡也换了,就会没有上面的选项,要手动将 raid 还原再回车出来上面的选项。
接着回车。
回车····看下面的个 redhat 不是我输入的,是他自己识别的,
还是回车····
在 description 上面回车弹出对话框在这里起个名。
在 data 回车,我就输个 1
然后 changes 一下。
退回到首界面然后 start options
在这里能发现刚才添加的启动项。直接回车就能进系统了
看已经进去了

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

10

添加新评论1 条评论

nbt3710nbt3710系统分析师保险
2018-04-02 17:00
如果服务器linux启动出现GRUB Loading stage2 。。该如何处理?

gzl@nbt3710 https://rc.mbd.baidu.com/7fsk41g 这个方法试过没?

2018-04-02 23:58
Ctrl+Enter 发表

本文隶属于专栏

活动总结
活动总结是社区交流活动内容的总结及延伸,为大家提供了社区专家们丰富且高水平的理论知识、实践经验以及常见问题的最佳解决方法,非常值得大家收藏学习。

作者其他文章

相关文章

相关问题

相关资料

X社区推广