9月下旬业务反馈ppl的机器I/O异常
经过月底几天和十一后几天的检查和官方的反馈确认
最终发现ppl的机器虽然好用
但是硬件层面的支持linux的监控做的并不完善
诸如阵列相关的监控并不触发--譬如阵列卡电池、硬盘故障等导致阵列状态降级的问题都不触发ASMI告警
所以外部巡检是不会发现异常的
而业务侧如果对I/O的监控并不细腻的话是不容易发现问题的存在的
備註下:vios虛擬化我這邊機器用的6版的aix,ppl機器都是power Linux7R1/2的,vios的話可以觸發前面板告警燈,asmi一样放弃治疗,vios裡面aix的話社區aix大佬應該都比我熟練errpt就可以了。—2018/12/10 2:09A
ppl上的linux通过iprconfig这个工具去维护阵列,检查状态、维护硬盘、操作raid||jdob等等
http://www14.software.ibm.com/support/customercare/sas/f/lopdiags/redhat/other/rhel6.html
官方可以通过搜索到支持ppl的工具
iprutils
lsvpd
libvpd2
iprutils
普通安装的话是应该ppc版本的linux包含的,如果无法使用可以升级或者重装lsvpd
用aix的高手应该都知道,我这个新手不赘述,就是IBM备件相关的fru信息收集libvpd2
没记错的话是lsvpd的DB库,如果ppc的系统原先没安装的话,第一次生成lsvpd会比较耗时,第二次执行就快了
iprconfig
可以通过man iprconfig
查看手册
普通可以直接回车执行进入交互界面操作
一般巡检可以查看
# iprconfig -c show-config
Name PCI/SCSI Location Description Status
------ ------------------------- ------------------------- -----------------
0000:80:00.0/0: PCI-E SAS RAID Adapter Operational
sda 0000:80:00.0/0:0:7:0 Physical Disk Active
sdb 0000:80:00.0/0:255:0:0 RAID 10 SSD Array Non-Optimized
0000:80:00.0/0:0:4:0 RAID 10 SSD Member Remote
0000:80:00.0/0:0:5:0 RAID 10 SSD Member Remote
sdc 0000:80:00.0/0:255:1:0 RAID 5 Array Non-Optimized
0000:80:00.0/0:0:9:0 RAID 5 Array Member Remote
0000:80:00.0/0:0:6:0 RAID 5 Array Member Remote
0000:80:00.0/0:0:8:0 RAID 5 Array Member Remote
0000:80:00.0/0:0:18:0 Enclosure Active
0000:80:00.0/0:2:18:0 Enclosure Active
0000:80:00.0/0:8:0:0 Enclosure Active
0002:90:00.0/1: PCI-E SAS RAID Adapter Operational
sdd 0002:90:00.0/1:0:7:0 Physical Disk Active
sde 0002:90:00.0/1:255:0:0 RAID 10 SSD Array Optimized
0002:90:00.0/1:0:4:0 RAID 10 SSD Member Active
0002:90:00.0/1:0:5:0 RAID 10 SSD Member Active
sdf 0002:90:00.0/1:255:1:0 RAID 5 Array Optimized
0002:90:00.0/1:0:6:0 RAID 5 Array Member Active
0002:90:00.0/1:0:8:0 RAID 5 Array Member Active
0002:90:00.0/1:0:9:0 RAID 5 Array Member Active
0002:90:00.0/1:0:18:0 Enclosure Active
0002:90:00.0/1:2:18:0 Enclosure Active
显示硬件状态
# iprconfig -c show-slots
Name Platform Location Description Status
------ -------------------------- ---------------------------- ------------
sg8 U78AB.001.WZSKYHW-P3-D1 RAID 10 SSD Member Active
sg9 U78AB.001.WZSKYHW-P3-D2 RAID 10 SSD Member Active
sg10 U78AB.001.WZSKYHW-P3-D3 RAID 5 Array Member Active
sdd U78AB.001.WZSKYHW-P3-D4 Physical Disk Active
sg12 U78AB.001.WZSKYHW-P3-D5 RAID 5 Array Member Active
sg13 U78AB.001.WZSKYHW-P3-D6 RAID 5 Array Member Active
查看硬盘槽位和硬盘状态即可
如下站内链接是P7-SAS RAID controllers for linux的红皮书
http://www.talkwithtrend.com/Document/detail/tid/420891
如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!
赞5
添加新评论1 条评论
2018-12-07 20:11