比如说线上出现故障时如何排查有问题的应用又不影响同一台主机其他应用服务的容器
在同一台主机上的容器是彼此隔离的,如果因为某个容器线上出现故障,并不会彼此互相影响。个人以为,在云的实现模式下,出现问题时更多的是通过应用部署的预期值和当前运行值之间出现不一致,云平台会自动实现二者一致。首先这保证了应用的正常服务和服务能力。生产出现问题,第一要义经常是先恢复生产,再定位和分析问题。对于出现问题的容器,一般会保留现场和日志的集中存储,后续可通过这些信息进行现场恢复和问题重放。
一般容器云平台里面都可以排查日志,通过日志来定位问题,如果目的是快速回复生产,那么直接干掉现有的pod,容器云平台会自动创新新的来代替原应用的。
云平台自愈能力发挥出来,直接踢掉有问题的,再弹性伸缩出来新的给系统用即可。简单粗野!:)
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30