容器云平台的运维管理？

容器云平台部署完成后，生产系统反应慢，有卡钝现像等类似问题如何处理？

参与11

4同行回答
全部行业
全部行业 工业制造其它 软件开发
|
按赞同排序
按时间排序

杜东明解决方案架构师灵雀云Alauda

需要先搞清楚卡顿的原因是什么，目前主流的监控数据收集工具是prometheus。容器平台部署完成后，使用监控系统查看平台组件及底层硬件的各项监控指标综合分析。主要可以看节点的资源量是否充裕，可以从CPU使用率、内存使用率、I/O性能例如IO延迟等多个方面进行考虑。如果容器平台是部署在IaaS上的虚拟机里的话，IaaS平台不建议超售。

收起

软件开发 · 2022-06-06

czm381263772解决方案架构苏州博纳讯动软件有限公司

针对容器云部署后出现卡顿：
1、可以使用linux性能检测工具top，监测服务器CPU使用、内存的占用、缓存大小、缓冲器以及进程标识，来判断当前运行服务性能损耗是多少。
2、从linux文件使用角度可以使用lsof工具对服务目录当前的磁盘情况、网络套字节等查看文件打开是否存在错误。
3、从网络角度，利用抓包软件捕获tcp/ip的数据包来分析网络转发情况。如：滑动窗口、mtu分片、端口等等信息判断网络时延、堵塞情况。
4、从运行服务角度，查看log日志中是否存在某些堆栈溢出情况或者程序报错相关异常。

收起

软件开发 · 2021-03-12

lsy1990Engineerhisense

针对卡顿问题，排除资源配置、网络等因素外，如果是java程序，还需要考虑JVM调教优化，向着短停顿时间—反应快的策略，使用CMS内存回收算法，具体配置： -XX:+UseConcMarkSweepGC，供参考

收起

软件开发 · 2021-01-27

查看赞同的人

zhangjian17平台运维海信

针对云上系统卡顿现象可以从以下几点考虑：
1、服务配置的cpu和内存是否过小；
2、云平台node节点与服务数据库是否在同一网段内，我们之前遇到过，不同网段的网络差异很大；
3、针对服务慢的情况，可以部署一个skywalking看下具体是哪里慢，并针对慢的问题具体分析解决；
4、如果业务量大，是否启动多pod进行流量分流；

收起

工业制造其它 · 2021-01-26

查看赞同的人

容器云平台的运维管理？

4同行回答
全部行业
全部行业 工业制造其它 软件开发
|
按赞同排序
按时间排序

提问者

问题来自

相关问题

相关资料

相关文章

问题状态

容器云平台的运维管理？

4同行回答全部行业全部行业工业制造其它软件开发|按赞同排序按时间排序

提问者

问题来自

相关问题

相关资料

相关文章

问题状态

4同行回答
全部行业
全部行业工业制造其它软件开发
|
按赞同排序
按时间排序