主机HBA卡频繁报DC73C03A 错误

E850主机,3块HBA卡,其中两块通过EMC 8510交换,连接Vmax40K和EMC 400F存储。某天一块HBA卡开始报错,如下:IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTIONDC73C03A   0816223816 T S fscsi0         SOFTW...显示全部

E850主机,3块HBA卡,其中两块通过EMC 8510交换,连接Vmax40K和EMC 400F存储。

某天一块HBA卡开始报错,如下:

IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION

DC73C03A   0816223816 T S fscsi0         SOFTWARE PROGRAM ERROR

DC73C03A   0816223816 T S fscsi0         SOFTWARE PROGRAM ERROR

DC73C03A   0816223816 T S fscsi0         SOFTWARE PROGRAM ERROR

DC73C03A   0816223816 T S fscsi0         SOFTWARE PROGRAM ERROR

ECCE4018   0816210116 T S fcs2           SOFTWARE PROGRAM ERROR

DCB47997   0816132016 T H hdisk96        DISK OPERATION ERROR

DCB47997   0815115716 T H hdisk94        DISK OPERATION ERROR

DCB47997   0815115616 T H hdisk50        DISK OPERATION ERROR

DC73C03A   0812205716 T S fscsi0         SOFTWARE PROGRAM ERROR

DC73C03A   0812205716 T S fscsi0         SOFTWARE PROGRAM ERROR

DC73C03A   0812205616 T S fscsi0         SOFTWARE PROGRAM ERROR

DC73C03A   0812205616 T S fscsi0         SOFTWARE PROGRAM ERROR

DC73C03A   0812205616 T S fscsi0         SOFTWARE PROGRAM ERROR

DC73C03A   0812205616 T S fscsi0         SOFTWARE PROGRAM ERROR

详细查看错误:

LABEL:          FCP_ERR6

IDENTIFIER:     DC73C03A

Date/Time:       Tue Aug 16 22:38:40 CST 2016

Sequence Number: 1733

Machine Id:      00FA17FA4C00

Node Id:         sop01

Class:           S

Type:            TEMP

WPAR:            Global

Resource Name:   fscsi0         

Description

SOFTWARE PROGRAM ERROR

        Recommended Actions

        PERFORM PROBLEM DETERMINATION PROCEDURES

打400电话报修,各种收集日志,主机的,san交换的,存储的,IBM和EMC反复扯皮推诿,都说是对方的原因,经过一番扯皮,最后决定由IBM来更换HBA卡,卡更换之后,fscsi0确实不在报错了。

没想到几天后,另一块连接存储的HBA卡也跟着凑热闹:

IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION

DC73C03A   0916202416 T S fscsi2         SOFTWARE PROGRAM ERROR

DC73C03A   0916202416 T S fscsi2         SOFTWARE PROGRAM ERROR

DC73C03A   0916202316 T S fscsi2         SOFTWARE PROGRAM ERROR

DC73C03A   0916202316 T S fscsi2         SOFTWARE PROGRAM ERROR

DC73C03A   0916202016 T S fscsi2         SOFTWARE PROGRAM ERROR

DC73C03A   0916202016 T S fscsi2         SOFTWARE PROGRAM ERROR

DC73C03A   0916201916 T S fscsi2         SOFTWARE PROGRAM ERROR

DC73C03A   0916201916 T S fscsi2         SOFTWARE PROGRAM ERROR

DC73C03A   0916201316 T S fscsi2         SOFTWARE PROGRAM ERROR

DC73C03A   0916201316 T S fscsi2         SOFTWARE PROGRAM ERROR

DC73C03A   0916201316 T S fscsi2         SOFTWARE PROGRAM ERROR

DC73C03A   0916201316 T S fscsi2         SOFTWARE PROGRAM ERROR

DC73C03A   0916194716 T S fscsi2         SOFTWARE PROGRAM ERROR

DC73C03A   0916194716 T S fscsi2         SOFTWARE PROGRAM ERROR

详细信息:

LABEL:          FCP_ERR6

IDENTIFIER:     DC73C03A

Date/Time:       Fri Sep 16 20:24:11 CST 2016

Sequence Number: 3436

Machine Id:      00FA17FA4C00

Node Id:         sop01

Class:           S

Type:            TEMP

WPAR:            Global

Resource Name:   fscsi2         

Description

SOFTWARE PROGRAM ERROR

        Recommended Actions

        PERFORM PROBLEM DETERMINATION PROCEDURES

报修IBM,又要换卡。。。。

请高手指点一下,我这一批一共买了八台E850,怎么就这台的两块卡都出问题,这个概率太有问题了,会不会是其他原因导致的?这台主机的业务很重要,停机换卡很麻烦,我怕这次换过之后第3块hba卡再报错。。。DC73C03A到底是什么错误,

收起
参与23

查看其它 3 个回答byethen的回答

byethenbyethen系统工程师CMBC

我的理解,

1. 一般TS的报错,的确不太像硬件的问题,可能跟HBA卡的参数设置有关系。

2. 换卡可以在线更换,不需要停机啊

3. 这台主机的业务特点跟其它有什么不同呢?

银行 · 2016-09-18
浏览6179
  • hba卡参数IBM检查了,没问题,计划在线换,但因为使用emc存储,需要更改某参数,必须重启。。
    2016-09-18
  • 感兴趣求教下,改什么参数需要重启?
    2016-09-21

回答者

byethen
系统工程师CMBC
擅长领域: 存储灾备服务器

byethen 最近回答过的问题

回答状态

  • 发布时间:2016-09-18
  • 关注会员:6 人
  • 回答浏览:6179
  • X社区推广