系统运行缓慢,某几个磁盘IO压力大?(技术交流)

问题背景描述:银行现有两台P780,两台机器做了rac,A节点的应用比较少,B节点的应用压力比较大,B节点应用压力是A节点的3倍左右。
1、现在B节点的系统出现性能问题,在工作日上午9点左右到下午6点左右出现系统卡慢现象。
通过iostat命令发现有三块磁盘的IO读写访问压力比较大,其他的都很正常,这三个磁盘(比如是hdisk10,hdisk11,hdisk12)被划分给一个LV,这个LV上的文件系统是一个存放应用的log的文件系统。
2、B节点上的应用是Tuxedo,且单个进程对应单个线程。通过收集B节点上的perfpmr给后线工程师分析后,后线给出的结论是应用有好多线程锁,同时对一个内存地址进行访问,而这个内存地址对应文件的正是这些应用的很多log文件。所有的log文件在内存中映射的内存地址都是相同的地址。
问题内容:
1、请问出现系统卡顿性能下降的情况,比如:运行一个topas命令很久才能输出结果;但是系统层面只是发现三个磁盘的IO访问压力大,别的指标都正常,请问系统层面还能做哪些方面的优化?
(首先,监控系统性能发现内存足够来高速缓存那些由正在运行进程使用的文件页面,换页空间使用也正常。
其次,存储方面不想做条带化,所以这点就不考虑了。
再者,也曾设想将现在压力大的盘除了center区域外的其他区域的数据分担到同一个VG的其他磁盘上,但是实际执行上有一定的难度,因为分担到其他盘的center区域上空闲的PPnumber都是不规律的,而且需要计算当前VG中目标盘center区域空间是否足够分担这三块盘的数据,所以不管数据量还是工作量都很大,另外手动迁移的话风险也很大,感觉效果也不会很明显,此方案不考虑了)
2、目前怀疑是应用侧开发使用的统一接口有问题,因为不同的服务输出Log在内存中对应的内存地址都相同。请问有什么方法能更清晰的定位应用程序中哪个函数的调用造成对内存访问不断的加线程锁?

71回答

NJYZINFONJYZINFO  IT顾问 , 南京元哲
回复  NJYZINFO 非常感谢您的支持,caichalou 发表于 2015-3-26 16:52     就是经验分享,别客气显示全部
回复  NJYZINFO

非常感谢您的支持,
caichalou 发表于 2015-3-26 16:52



    就是经验分享,别客气收起
 2015-03-31
浏览472
NJYZINFONJYZINFO  IT顾问 , 南京元哲
会不会是IO的性能问题呢? 由于应用不合理的性能需求导致系统性能出现瓶颈?可以用nmon然后看看IOPS大概是 ...phanx 发表于 2015-3-25 22:46 nmon analyzer只能做一天的数据处理,估算IOPS及Throughput不是只看一天就可以,还要比较整理,2台主机给您30天的nmon数据,要搞多久呀?...显示全部
会不会是IO的性能问题呢? 由于应用不合理的性能需求导致系统性能出现瓶颈?
可以用nmon然后看看IOPS大概是 ...
phanx 发表于 2015-3-25 22:46


nmon analyzer只能做一天的数据处理,估算IOPS及Throughput不是只看一天就可以,还要比较整理,2台主机给您30天的nmon数据,要搞多久呀?收起
 2015-03-31
浏览470
NJYZINFONJYZINFO  IT顾问 , 南京元哲
回复  北京荣歆咨询     “存储方面不想做条带化”是啥意思?-----就是我们银行不想做raid0。更换SSD是 ...caichalou 发表于 2015-3-16 19:27 了解应用的高峰及离峰下的传输带宽需求(Throughput)及吞吐量(IOPS)需求,就可以知道该用什么样的磁盘来满足...显示全部
回复  北京荣歆咨询


    “存储方面不想做条带化”是啥意思?-----就是我们银行不想做raid0。更换SSD是 ...
caichalou 发表于 2015-3-16 19:27


了解应用的高峰及离峰下的传输带宽需求(Throughput)及吞吐量(IOPS)需求,就可以知道该用什么样的磁盘来满足性能及效能的需求,此外,以为用的是RAC,是由ORACLE的ASM来进行存储管理,卷区及数据文件的分配也是相当重要的,很多用户都是为了管理方便,没做适当的分配,把存储性能给浪费了!收起
 2015-03-31
浏览399
caichaloucaichalou  系统工程师 , 中国邮政储蓄银行
回复 48# NJYZINFO 非常感谢您的支持,:handshake显示全部
回复 48# NJYZINFO

非常感谢您的支持,:handshake收起
 2015-03-26
浏览396
NJYZINFONJYZINFO  IT顾问 , 南京元哲
回复  NJYZINFO     正是因为没有长期收集正常时的性能参数,才导致现在出现问题了才想办法解决的。数据 ...caichalou 发表于 2015-3-25 20:45 现在开始也不晚,调试的过程中更需要整体资源运行状况的信息,才能有效的解决问题所在,需要协助您可也跟我联...显示全部
回复  NJYZINFO


    正是因为没有长期收集正常时的性能参数,才导致现在出现问题了才想办法解决的。数据 ...
caichalou 发表于 2015-3-25 20:45


现在开始也不晚,调试的过程中更需要整体资源运行状况的信息,才能有效的解决问题所在,需要协助您可也跟我联系。收起
 2015-03-26
浏览437
teddyshboteddyshbo  系统工程师 , 柯莱特
留脚印,等结果,看方案,哈哈显示全部
留脚印,等结果,看方案,哈哈收起
 2015-03-26
浏览402
caichaloucaichalou  系统工程师 , 中国邮政储蓄银行
回复 45# phanx 这位仁兄很给力哦,非常感谢!回头我跟领导确认一下,如果可以动作就开始按照您的方案试试,收集下数据。至于存储划三个LUN,这个件事需要跟存储相关人员协商,我们这边分工比较细,所以动作起来很不方便,我没有直接操作存储的权限。:(...显示全部
回复 45# phanx

这位仁兄很给力哦,非常感谢!回头我跟领导确认一下,如果可以动作就开始按照您的方案试试,收集下数据。至于存储划三个LUN,这个件事需要跟存储相关人员协商,我们这边分工比较细,所以动作起来很不方便,我没有直接操作存储的权限。:(收起
 2015-03-26
浏览399
phanxphanx  系统工程师 , 银行
现在的AIX都是自带nmon, nmon和topas已经合并不需要额外安装,topas按 ~ 键就可以切换到nmon状态。记录信息只需要任何一个普通用户执行cd && mkdir nmondata nmon -s60 -c1440 -f -m /home/xxxxx/nmondata这样就会在后台每分钟记录数据了。还有,如果没法确定存储性能是否够好...显示全部
现在的AIX都是自带nmon, nmon和topas已经合并不需要额外安装,topas按 ~ 键就可以切换到nmon状态。

记录信息只需要任何一个普通用户执行
cd && mkdir nmondata
nmon -s60 -c1440 -f -m /home/xxxxx/nmondata
这样就会在后台每分钟记录数据了。

还有,如果没法确定存储性能是否够好,还是建议测试一下,可以选取在业务低谷期做嘛。
三个LUN而已,影响很小的。收起
 2015-03-26
浏览397
caichaloucaichalou  系统工程师 , 中国邮政储蓄银行
回复 42# phanx 嗯,谢谢您的回复,您的建议很有参考价值。后续我们会跟客户沟通部署nmon工具的,至于在存储上划出三个LUN来做测试估计很困难了,生产系统对性能和资源的要求都很强,另外为了安全方面考虑,感觉客户是不会同意做的。至于硬件加速,比如使用Flash Adapter 90卡、SSD等...显示全部
回复 42# phanx

嗯,谢谢您的回复,您的建议很有参考价值。后续我们会跟客户沟通部署nmon工具的,至于在存储上划出三个LUN来做测试估计很困难了,生产系统对性能和资源的要求都很强,另外为了安全方面考虑,感觉客户是不会同意做的。至于硬件加速,比如使用Flash Adapter 90卡、SSD等这些都需要跟客户协商好,走流程,然后才能用上,再者客户觉得系统以前用的好好的,现在也该没问题,除非拿出实际有说服力的数据才能说服客户采购新设备。所以硬件方面改善性能需从长计议。现在可行的可能也就允许部署一个nmon工具了。收起
 2015-03-26
浏览421
caichaloucaichalou  系统工程师 , 中国邮政储蓄银行
嗯,谢谢您的回复,您的建议很有参考价值。后续我们会跟领导沟通部署nmon工具的,至于在存储上划出三个LUN来做测试估计很困难了,生产系统对性能和资源的要求都很强,另外为了安全方面考虑,感觉客户是不会同意做的。至于硬件加速,比如使用Flash Adapter 90卡、SSD等这些都需要跟客户...显示全部
嗯,谢谢您的回复,您的建议很有参考价值。后续我们会跟领导沟通部署nmon工具的,至于在存储上划出三个LUN来做测试估计很困难了,生产系统对性能和资源的要求都很强,另外为了安全方面考虑,感觉客户是不会同意做的。至于硬件加速,比如使用Flash Adapter 90卡、SSD等这些都需要跟客户协商好,走流程,然后才能用上,再者客户觉得系统以前用的好好的,现在也该没问题,除非拿出实际有说服力的数据才能说服客户采购新设备。所以硬件方面改善性能需从长计议。现在可行的可能也就允许部署一个nmon工具了。收起
 2015-03-26
浏览408

提问者

caichalou系统工程师, 中国邮政储蓄银行

问题状态

  • 发布时间:2015-03-13
  • 关注会员:3 人
  • 问题浏览:26565
  • 最近回答:2015-12-22
  • 关于TWT  使用指南  社区专家合作  厂商入驻社区  企业招聘  投诉建议  版权与免责声明  联系我们
    © 2019  talkwithtrend — talk with trend,talk with technologist 京ICP备09031017号-30