LinuxONE服务器采用了具有50多年历史的主机硬件架构。其通过10多代的研发,不断增加新的可靠性功能来不断减少资源不可用的情况。其高可用设计原理如下:
通过研究前代的服务器RAS属性及实际效果,进行改进
研究业界信息,获得相关RAS的参考
理解可靠性技术(硬件和软件)的发展趋势,确保RAS设计可以有效满足这些要求
增加RAS设计,包括硬件和微码,以此来给LinuxONE和客户带来独一无二的价值.
通过ITIC( INFORMATION TECHNOLOGY INTELLIGENCE CONSULTING)发布的全球服务器硬件操作系统可靠性报告可用看出,IBM运行Linux的主机(LinuxONE)年化意外宕机时间只有0.91分钟,是业界最高标准。
由于LinuxONE机器内部部件都是采用N+1以上的设计,因此在但模块出现故障时,进行及时维修就可以避免由于出现双点故障引起的其他问题。这就要求在运维过程中,做到经常巡检,出现故障及时处理。
在金融行业,由于高可用需求更高,针对这样的场景还是建议上多台机器,减少运维风险。
收起linuxone服务器主要运行的是linux操作系统,例如redhat或者suse。以redhat举例,平时用x86平台的命令很熟悉,不知道在linuxone上的命令是否都一样,并且linuxone上是否增加了一些像power一样的热插拔命令呢?
同时linuxone设备多个系统整合度很高,例如pci设备是需要化后分给系统的还是独享分配给系统的,如果独享分配给系统的,更换设备是否还是需要停分区更换
1、linuxone单台需要整合很多的业务系统,一旦出问题,可能会形成大片业务异常,如何保障和避免?
2、运维风险:现在熟悉linuxone的人员很少,如何实现厂家向用户工程师的技术传递,提高运维能力?我觉得才是产品应用广泛的一个前提。