系统运行缓慢,某几个磁盘IO压力大?(技术交流)

问题背景描述:银行现有两台P780,两台机器做了rac,A节点的应用比较少,B节点的应用压力比较大,B节点应用压力是A节点的3倍左右。
1、现在B节点的系统出现性能问题,在工作日上午9点左右到下午6点左右出现系统卡慢现象。
通过iostat命令发现有三块磁盘的IO读写访问压力比较大,其他的都很正常,这三个磁盘(比如是hdisk10,hdisk11,hdisk12)被划分给一个LV,这个LV上的文件系统是一个存放应用的log的文件系统。
2、B节点上的应用是Tuxedo,且单个进程对应单个线程。通过收集B节点上的perfpmr给后线工程师分析后,后线给出的结论是应用有好多线程锁,同时对一个内存地址进行访问,而这个内存地址对应文件的正是这些应用的很多log文件。所有的log文件在内存中映射的内存地址都是相同的地址。
问题内容:
1、请问出现系统卡顿性能下降的情况,比如:运行一个topas命令很久才能输出结果;但是系统层面只是发现三个磁盘的IO访问压力大,别的指标都正常,请问系统层面还能做哪些方面的优化?
(首先,监控系统性能发现内存足够来高速缓存那些由正在运行进程使用的文件页面,换页空间使用也正常。
其次,存储方面不想做条带化,所以这点就不考虑了。
再者,也曾设想将现在压力大的盘除了center区域外的其他区域的数据分担到同一个VG的其他磁盘上,但是实际执行上有一定的难度,因为分担到其他盘的center区域上空闲的PPnumber都是不规律的,而且需要计算当前VG中目标盘center区域空间是否足够分担这三块盘的数据,所以不管数据量还是工作量都很大,另外手动迁移的话风险也很大,感觉效果也不会很明显,此方案不考虑了)
2、目前怀疑是应用侧开发使用的统一接口有问题,因为不同的服务输出Log在内存中对应的内存地址都相同。请问有什么方法能更清晰的定位应用程序中哪个函数的调用造成对内存访问不断的加线程锁?
参与77

71同行回答

l7859485l7859485项目经理hefi
应该是应用的问题,需要定位一下。显示全部

应该是应用的问题,需要定位一下。

收起
系统集成 · 2015-12-22
浏览8075
NJYZINFONJYZINFOIT顾问南京元哲
这种问题首先可以定位于应用开发的不合理,具体过程如下:1.业务人员在查询时,一个大的SQL就可以把系统搞 ...manganese_zh 发表于 2015-4-2 18:22 我们的经验中,有些SQL语句问题存在已久,资源也持续占用很高也许达30-40,这是需要长期调养的,但其它一些的SQL业务原来资源占用并不...显示全部
这种问题首先可以定位于应用开发的不合理,具体过程如下:
1.业务人员在查询时,一个大的SQL就可以把系统搞 ...
manganese_zh 发表于 2015-4-2 18:22


我们的经验中,有些SQL语句问题存在已久,资源也持续占用很高也许达30-40,这是需要长期调养的,但其它一些的SQL业务原来资源占用并不高,比如占5%作业,如果发生问题时,这些业务占用有达到10%,如果仔细观察,这养业务资源占用成长达100%,其实是非正常的状态,但与占用高资源的SQL业务相比,这些问题经常会被忽略,多几个这样的语句资源就会被耗尽,而在AWR报告中是很难发现的。收起
系统集成 · 2015-04-03
浏览7989
NJYZINFONJYZINFOIT顾问南京元哲
回复  NJYZINFO 专家不敢当啊,碰到抬杠的了你应该考虑换一个强点的机器来跑或者降低你的采集频度, ...phanx 发表于 2015-4-2 10:49 数据,采集内容时间点都是客户给我们的,还有有2000多个PV,我们当然有自己的分析工具,半天就理完数据,开始写分析报告了,但被要求拿这an...显示全部
回复  NJYZINFO

专家不敢当啊,碰到抬杠的了
你应该考虑换一个强点的机器来跑或者降低你的采集频度, ...
phanx 发表于 2015-4-2 10:49


数据,采集内容时间点都是客户给我们的,还有有2000多个PV,我们当然有自己的分析工具,半天就理完数据,开始写分析报告了,但被要求拿这analyzer做对比,就是一个惨字呀。

analyzer没有这样的功能就好,不然就没得混了收起
系统集成 · 2015-04-02
浏览7927
NJYZINFONJYZINFOIT顾问南京元哲
回复  NJYZINFO 看来你没有看懂上面我写的命令的含义。    analyzer不是一天的数据,是根据你nmon文件 ...phanx 发表于 2015-4-1 15:16     感谢指导,看来碰上专家了,以前都只用一天的数据分析,但不知同时30天的数据同时分析要多长时间? 我曾...显示全部
回复  NJYZINFO

看来你没有看懂上面我写的命令的含义。

    analyzer不是一天的数据,是根据你nmon文件 ...
phanx 发表于 2015-4-1 15:16



    感谢指导,看来碰上专家了,以前都只用一天的数据分析,但不知同时30天的数据同时分析要多长时间? 我曾有过这样的经验 - 每天一个文件的数据分析大约要 30 分钟, 分析3个后Excel就挂了, 两台主机60个文件搞得头昏脑涨地!

   此外, 想做一周中每天的CPU时用率的比较,7天要分在七个图表,磁盘忙率,IOPS..等都要做,7天做完要做30天,请问要怎么在analyzer中执行?收起
系统集成 · 2015-04-02
浏览1929
NJYZINFONJYZINFOIT顾问南京元哲
回复  NJYZINFO     也是用nmon analyzer 来生成xlsx文件,然后分析。这样就不止一天的数据了。 ...phanx 发表于 2015-4-1 11:45     analyzer也只是生成一天的数据及图表, 要自行合并及制作图表(还要有点EXCEL的基础)....太累人了, 所以很...显示全部
回复  NJYZINFO


    也是用nmon analyzer 来生成xlsx文件,然后分析。这样就不止一天的数据了。 ...
phanx 发表于 2015-4-1 11:45



    analyzer也只是生成一天的数据及图表, 要自行合并及制作图表(还要有点EXCEL的基础)....太累人了, 所以很多人都不会经常做, 累积一段时间后就放弃了! 要有效率,分析工具很重要的!收起
系统集成 · 2015-04-01
浏览1970
NJYZINFONJYZINFOIT顾问南京元哲
回复  NJYZINFO     nmon 有个采集间隔。/usr/bin/nmon -s420 -c1440 -f -m /home/nmon这样是一周 ...phanx 发表于 2015-3-31 14:03 重点是采集完后如何使用这些数据呢?显示全部
回复  NJYZINFO


    nmon 有个采集间隔。

/usr/bin/nmon -s420 -c1440 -f -m /home/nmon

这样是一周

...
phanx 发表于 2015-3-31 14:03


重点是采集完后如何使用这些数据呢?收起
系统集成 · 2015-04-01
浏览1819
NJYZINFONJYZINFOIT顾问南京元哲
回复  phanx 嗯,谢谢您的回复,您的建议很有参考价值。后续我们会跟客户沟通部署nmon工具的,至于在存储 ...caichalou 发表于 2015-3-26 08:35 "有说服力的数据" - 就是要做分析更整理,光是几天nmon的数据是没法看出端倪的!这是很多人做不到的,呵呵!...显示全部
回复  phanx

嗯,谢谢您的回复,您的建议很有参考价值。后续我们会跟客户沟通部署nmon工具的,至于在存储 ...
caichalou 发表于 2015-3-26 08:35


"有说服力的数据" - 就是要做分析更整理,光是几天nmon的数据是没法看出端倪的!这是很多人做不到的,呵呵!收起
系统集成 · 2015-03-31
浏览1670
NJYZINFONJYZINFOIT顾问南京元哲
回复  NJYZINFO 非常感谢您的支持,caichalou 发表于 2015-3-26 16:52     就是经验分享,别客气显示全部
回复  NJYZINFO

非常感谢您的支持,
caichalou 发表于 2015-3-26 16:52



    就是经验分享,别客气收起
系统集成 · 2015-03-31
浏览1576
NJYZINFONJYZINFOIT顾问南京元哲
会不会是IO的性能问题呢? 由于应用不合理的性能需求导致系统性能出现瓶颈?可以用nmon然后看看IOPS大概是 ...phanx 发表于 2015-3-25 22:46 nmon analyzer只能做一天的数据处理,估算IOPS及Throughput不是只看一天就可以,还要比较整理,2台主机给您30天的nmon数据,要搞多久呀?...显示全部
会不会是IO的性能问题呢? 由于应用不合理的性能需求导致系统性能出现瓶颈?
可以用nmon然后看看IOPS大概是 ...
phanx 发表于 2015-3-25 22:46


nmon analyzer只能做一天的数据处理,估算IOPS及Throughput不是只看一天就可以,还要比较整理,2台主机给您30天的nmon数据,要搞多久呀?收起
系统集成 · 2015-03-31
浏览1597
NJYZINFONJYZINFOIT顾问南京元哲
回复  北京荣歆咨询     “存储方面不想做条带化”是啥意思?-----就是我们银行不想做raid0。更换SSD是 ...caichalou 发表于 2015-3-16 19:27 了解应用的高峰及离峰下的传输带宽需求(Throughput)及吞吐量(IOPS)需求,就可以知道该用什么样的磁盘来满足...显示全部
回复  北京荣歆咨询


    “存储方面不想做条带化”是啥意思?-----就是我们银行不想做raid0。更换SSD是 ...
caichalou 发表于 2015-3-16 19:27


了解应用的高峰及离峰下的传输带宽需求(Throughput)及吞吐量(IOPS)需求,就可以知道该用什么样的磁盘来满足性能及效能的需求,此外,以为用的是RAC,是由ORACLE的ASM来进行存储管理,卷区及数据文件的分配也是相当重要的,很多用户都是为了管理方便,没做适当的分配,把存储性能给浪费了!收起
系统集成 · 2015-03-31
浏览1475

提问者

caichalou
系统工程师中国邮政储蓄银行
擅长领域: 服务器存储云计算

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2015-03-13
  • 关注会员:3 人
  • 问题浏览:57450
  • 最近回答:2015-12-22
  • X社区推广