故障维护 - 主题 - twt企业IT交流平台

问题
热度排序 时间排序

保险Linux·2023-03-09

应用日志文件被删，空间无法释放？

JasonChang

· 自贡银行股份有限公司　擅长领域：数据库, 服务器, 数据库选型

7 会员关注

这种情况首先是要通过lsof找到被标记删除的文件，然后通过 > deleted.file 来将该文件覆盖，以释放空间，同时保障应用可继续往该文件写入日志。

政府机关故障维护·2023-06-06

zwz99999 · dcits　擅长领域：服务器, 存储, 灾备

1095 会员关注

提示已经被踢到了，直接插盘加入磁盘组试试

赞同3

回答6

关注7

软件开发系统运维·2022-01-10

凭实力讲，运维工程师能不能做到预言家，未卜先知发现问题？

zhanxuechao · 数字研究院　擅长领域：云计算, 数据库, 安全

45 会员关注

说实话挺难的。但是我们可以预演一些基础内容，如根据存储空间单位时间增长量判断空间什么时候会满，会导致因空间产生的故障；可以根据存储或硬盘的IOPS波动范围预判系统异常情况，推断系统响应速度；根据日志中的异常信息判断响应的错误信息等；运维故障发生的偶发性多于必然性，一些...

系统集成故障维护·2020-06-29

youki2008 · DDT　擅长领域：服务器, 云计算, 数据库

255 会员关注

这种情况很少见，不过你可以退出vcenter后重新登录试一下看看

IT其它故障维护·2020-06-03

zwz99999 · dcits　擅长领域：服务器, 存储, 灾备

1095 会员关注

报错上看是电源和IO问题，检查一下吧

系统集成故障维护·2016-10-11

myciciy · 某金融科技公司　擅长领域：服务器, 存储, 灾备

1240 会员关注

微码问题，升级到6.4以上就好了.建议有条件继续升级到7.4以上

硬件生产故障维护·2018-11-20

myciciy · 某金融科技公司　擅长领域：服务器, 存储, 灾备

1240 会员关注

7.4不用走向导更换了，直接换就完事了

赞同4

回答5

关注6

银行故障维护·2016-11-29

如何合理规划系统，从而减少LinuxONE因硬件停机维护而导致的维护时长和风险？

s6dong · 东软集团　擅长领域：存储, 服务器, 灾备

960 会员关注

一般的LINUXONE运维不需要全部停机，大部分LINUXONE组件是可以在线升级和维护的，建议在规划虚拟机是合理配置资源，最好留有一些冗余部件，可以在主动运维时进行系统内部迁移，分批次进行运维。...

赞同

回答3

关注4

电信运营商容器化部署·2019-12-25

对于容器化故障运维保障有哪些建议？

朱祥磊 · 某移动公司　擅长领域：人工智能, 云计算, 容器

98 会员关注

对于容器化故障运维保障，需要做到以下几个方面：1 对整个集群的状态，做健康检查，目前可以通过prometheus, Grafana监控系统 ,通过prometheus定期抓取指标，设置告警，送到altermanager,altermanager调用短信网关，或者邮件，就可以下发短信，或者邮件告警，这样运维人员可以立马相应处理...

系统集成内存抖动·2016-06-19

内存抖动判断流程

问题热度排序时间排序

描述

问题
热度排序时间排序