企业大部分容器化后如何快速定位问题,分析故障?

容器化的应用,也就是以前直接运行在操作系统之上大的单体应用程序,需要根据单体应用架构,拆分为许多微服务,基本上每个微服务都运行在独立的一个容器里面,紧密耦合的微服务1 目前公司上线了部分pass平台(基于k8s)  大部分问题出现的原因基于一些简单的故障,但是很多分析定位都...显示全部

容器化的应用,也就是以前直接运行在操作系统之上大的单体应用程序,需要根据单体应用架构,拆分为许多微服务,基本上每个微服务都运行在独立的一个容器里面,紧密耦合的微服务
1 目前公司上线了部分pass平台(基于k8s)
  大部分问题出现的原因基于一些简单的故障,但是很多分析定位都是一线运维同事遇到很多挑战,如果选型一款可以降低一线运维定位分析的平台或者工具?是否有可以借鉴的方案

收起
参与20

查看其它 4 个回答zhuqibs的回答

zhuqibszhuqibs软件开发工程师Adidas

问题的定位
(1)容器频繁restart:日志, kubectl logs -f 永远是首选;
(2)状态error: kubectl describe pod 可以描述容器当前什么状态卡住了;
(3)Terminaling: kubectl get pod/svc -owide 看到容器在哪个节点
(4)业务性能问题:接口问题看skywalking;
(5)没有日志: 流量根本没进pod,查看容器云外面的应用;
(6)容器表面正常,内部日志报错: 可能core-dns或kube-dns,解析错误。

互联网服务 · 2020-04-05
浏览3326

回答者

zhuqibs
软件开发工程师Adidas
擅长领域: 云计算服务器存储

zhuqibs 最近回答过的问题

回答状态

  • 发布时间:2020-04-05
  • 关注会员:7 人
  • 回答浏览:3326
  • X社区推广