RS6000
作者RS6000·2023-01-30 11:22
售前技术支持·浪潮商用机器有限公司

Suse 15 SP3 for Power 注销切换用户,系统自动重启

字数 839阅读 1506评论 0赞 0

Suse 15 SP3 for Power 注销切换用户,系统自动重启

客户测试过程中 4 台 PowerLinux服务器在 SUSE 注销或切换用户出现系统字宗重启。

测试过程:

显示器连接 VGA 接口,通过显示器终端进行切换用户和注销操作都会导致系统自动重启,而且系统有时候自动重启过程中起不来,然后再次自动重启 2-3 次系统才会起来,此时主机上面板上的故障灯会亮起来。

显示器连接 VGA 接口,通过远程 KVM 界面进行切换用户和注销操作都会导致系统自动重启,而且系统有时候自动重启过程中起不来,然后再次自动重启 2-3 次系统才会起来,此时主机上面板上的故障灯会亮起来。

VGA 接口不连接显示器,通过远程 KVM 界面进行切换用户和注销操作,系统正常无故障。

另外之前测试机一直没有问题的那台,因为客户没有显示器链接 VGA 接口,所以一直没有问题,今天我把那台连接显示器进行测试,故障现象跟上述三种情况一致。

测试总结:

从上面的测试可以看出,本次故障很可能跟 VGA 连接显示器(测试了 3 个不同显示器,现象一样)有关系,问题可能处在板载 VGA 驱动程序或者操作系统层面。

问题原因分析:

产生错误的直接原因就是non cache的操作数据在cache中,即软件在使用同一地址的时候变换了cache属性,导致了cache的冲突,进而触发checkstop 错误

过对比分析redhat kernel及社区 kernel 驱动源码发现在Linux 5.8 之前 drm ttm 驱动(显示内存管理)中power 架构分配内存的接口为vmap(非原子操作可睡眠),而x86架构接口为kmap_atomic_prot(原子操作同时flush TLB),所以这个问题在现象上表现为跟体系结构相关

问题解决方法:

在 Linux kernel 5.8 版本之后所有的架构都切换为 kmap_atomic_prot.

rhel8.2也存在类似问题,rhel8.4已解决,suse15.4也已解决

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

0

添加新评论0 条评论

Ctrl+Enter 发表

作者其他文章

相关问题

X社区推广