wanggeng
作者wanggeng·2023-09-07 13:51
系统运维工程师·某银行

中小银行NAS管理策略难点

字数 5415阅读 739评论 0赞 5

课题概要

本文重点围绕中小银行NAS运维管理的策略难点进行展开讨论总结:应用如何规范而高效地访问NAS、 NAS的性能监控 、 快速分析NAS存储类基础设施对应用投入和产出分析、 NAS设备上的众多文件系统进行性能负载隔离控制。

课题主持

王进 某城商行资深工程师
目前主要负责银行数据中心基础环境运维工作:服务器、存储、网络等方面的运维及管理工作。擅长容灾、私有云建设方面。

课题指导:

twt社区存储领域专业委员—— 中原银行系统架构师 朱向东
twt社区存储领域专业委员 ——某农商银行存储架构师袁宏松
twt社区存储领域专业委员 ——某金融企业存储架构师徐志国
twt社区专家 ——某股份制银行存储架构师李铭

课题协作:

twt社区专家 ——某省农信存储架构师康建国
twt社区专家 ——某股份制银行存储架构师李铭

一、背景:

随着银行业务的发展,NAS文件存储以其组网简单的特性和技术更迭更加适应新场景,呈现出新趋势。NAS存储有其传统场景,如虚拟化、文件共享、高性能的海量小文件等等。数字化时代,人们对实时性要求越来越高,因而需要更高性能存储。NAS存储拥有更低的时延、更高的性能、更好的可靠性,利用NAS存储构建业务系统间文件交互平台,显著提升了业务处理效率。如何有效的监控NAS系统的性能与合理的容量规划避免资源浪费和不足?如何合理的规划和制定NAS管理策略,是充份的发挥NAS存储的效率和实现高效文件共享的保证,下面是本次活动的几个核心探讨难点:

二、中小银行NAS管理策略难点

1、对于应用如何规范而高效地访问NAS有没有有效的控制或者管理办法 ?

只能提前制定使用规范通知应用,比如目录下的文件存放尽量均衡,避免使用遍历命令等,但至于应用是否遵守规范没有有效的约束措施?

针对NAS的使用规范通知应用,确实是一个非常重要的措施,可以帮助银行行业的员工更好地使用NAS,从而避免一些潜在的问题。但是,仅依靠规范通知是不够的,还需要配合一些有效的约束措施,才能确保员工遵守规范。以下是一些约束措施:

(1)监控和审计:银行可以使用监控和审计工具来跟踪NAS的使用情况,检查员工是否遵守规范。如果发现有员工违反规范,可以及时采取措施,例如提醒员工、限制权限等。

(2)奖惩制度:银行可以建立奖惩制度,对遵守规范的员工进行奖励,对违反规范的员工进行惩罚。这样可以增强员工的规范意识,促使他们更好地遵守规范。

(3)培训和教育:银行可以定期对员工进行NAS的使用培训和教育,让员工了解规范的重要性,掌握正确的使用方法。这样可以提高员工的规范意识和技能水平,减少规范违反的可能性。

(4)技术限制:银行可以在NAS上设置一些技术限制,例如禁止使用危险的命令、限制文件大小等。这样可以减少员工违反规范的可能性,保障NAS的安全和稳定性。从技术方面限制规范NAS使用是非常必要的,包括基础设施管理和非功能需求两个方面:
基础设施管理方面包括
1)根据不同应用对NAS的访问需求,制定适当的访问策略。例如,对于需要频繁读取数据的应用,可以将数据缓存到本地,以减少对NAS的访问次数,提高访问效率。
2)为了保证数据的安全和完整性,需要对NAS进行适当的访问权限限制。可以根据不同用户或应用的需求,设置不同的访问权限,以确保数据只能被授权用户或应用访问。
3)对于NAS中的不同数据,进行分类管理。例如,将访问频率较高的数据和访问频率较低的数据分别存储在不同的存储设备中,以提高访问效率和降低成本。
4)了解不同应用对NAS的访问情况,需要有针对性的对NAS进行实时监控。如果发现某个应用对NAS的访问频率过高或者访问数据过大,可以及时对其进行限制或者调整,以保证NAS的稳定性和性能。
5)根据应用的需求和数据的特性,选择适当的NAS设备和存储方案,以满足应用对数据访问的要求,并提高访问效率和稳定性。
6)若对NAS存储的需求较多且承载业务重要程度较高时,可以考虑购买多套NAS存储进行存储故障域的拆分,以及本地双机高可用或跨机房容灾等方案。
7)应用系统挂载NAS存储共享卷建议采用域名方式。
8)明确每个NAS卷的快照或备份的频率以及保留周期。
9)NAS要设置客户端异常访问次数和中断时间。

非功能需求方面包括
1)约束应用系统集群内或应用系统集群间的联机NAS共享场景,例如:一套应用系统集群内部可使用NFS作为共享文件系统,不同应用系统之间要仔细规划共享文件系统的使用,如采用共享文件系统下不同子目录的方式进行业务系统的区分。
2)应用系统必须明确每个NAS共享卷中数据的生命周期。例如:临时文件共享保留7天,到期必须删除。
3)应用系统必须明确每个NAS共享卷的容量及IOPS需求。
4)应用系统申请的每个NAS共享卷中文件数量不允许超过限值。
5)应用系统进程运行所需参数文件不允许直接放在NAS共享卷中。
6)应用系统程序不允许通过遍历方式频繁扫描NAS共享卷和统计文件等操作。

综上所述,银行行业在使用NAS时,不仅需要制定使用规范通知应用,还需要采取一些有效的约束措施,以确保员工遵守规范,保障NAS的安全性和稳定性。

2、如何使用QoS功能对同一台NAS设备上的众多文件系统进行性能负载隔离控制?

针对带宽、IOPS等指标如何设置Qos阈值,是单独给每个文件设置还是分类设置,有没有规范的设置建议。如何针对同一台NAS设备上的众多文件系统进行性能负载隔离控制?

使用QoS功能可以对同一台NAS设备上的众多文件系统进行性能负载隔离控制,以确保每个文件系统获得足够的带宽和IOPS资源。以下是一些针对带宽、IOPS等指标如何设置QoS阈值以及如何对文件系统进行分类设置的建议:
(1)在设置QoS阈值时,需要根据不同文件系统的访问需求和重要性进行分类设置。例如,对于一些关键的业务文件系统,可以设置较高的带宽和IOPS阈值,以确保其获得足够的资源;对于一些不重要的文件系统,则可以设置较低的阈值,以避免浪费资源。
(2)在进行QoS控制时,需要将文件系统进行分类设置。可以根据不同文件系统的访问模式、访问频率、访问类型等特征进行分类,以便更好地控制其性能负载。例如,将访问频率高、对性能要求较高的文件系统划分到高优先级组,将访问频率低、对性能要求较低的文件系统划分到低优先级组。

(3)在进行QoS控制时,需要对不同类型的文件进行分类,例如视频文件、音频文件、文档文件等,然后根据不同类型的文件设置不同的QoS阈值。对于需要高带宽和高IOPS的文件,可以设置较高的QoS阈值,以保证其传输的速度和效率;对于一些不需要高带宽和高IOPS的文件,可以设置较低的QoS阈值,以避免其占用过多的网络资源。

(4)需要根据网络负载情况进行动态调整QoS阈值。当网络负载较高时,可以适当降低QoS阈值,以保证网络的稳定性和可靠性;当网络负载较低时,可以适当提高QoS阈值,以提高文件传输的速度和效率。

(5)需要根据NAS的性能负载情况进行QoS阈值的设置。当NAS的性能负载较高时,可以适当降低QoS阈值,以避免其过度负载;当NAS的性能负载较低时,可以适当提高QoS阈值,以提高文件传输的速度和效率。

(6)在设置QoS阈值和分类设置文件系统后,需要对其进行监控和调整。可以使用性能监控工具对文件系统进行监控,及时发现性能瓶颈和资源利用率问题,并根据实际情况进行调整。
(7)不同NAS设备厂商的QoS实现方式和设置方法存在一定的差异,建议参考厂商提供的建议和文档进行设置和调整。

最后,建议要根据自身实际情况来考虑是否采用QoS功能,不同业务系统的交易量增长和功能版本迭代,或营销活动等可能会导致对NAS存储的需求变动,采用QoS后管理复杂度会增加,而且在存储层面或应用系统层面也不便于准确的衡量新需求的QoS阈值,若设置不合适的QoS后可能导致次生的生产风险。因此,建议日常加强对存储性能的监控,对网络流量、存储容量、控制器处理能力、吞吐量、IOPS等指标进行分析,若发现潜在性能问题时,有针对性的采取措施来规避风险隐患。同时,可以根据长期的监控数据分析总结出合适的QoS指标来提升存储的管控能力。

3、NAS的性能监控该如何进行 ?

一般NAS的性能监控主要是针对整台NAS的CPU、IOPS、平均时延等指标,是否需要针对单个文件系统的性能指标进行设置,每家NAS品牌不一定支持单文件系统性能监控,这个时候NAS的性能监控应该如何进行?

(1)在银行行业中,NAS通常用于存储重要的数据和文件,因此性能监控对于保障数据安全和业务连续性非常重要。一般来说,NAS的性能监控需要关注整台NAS的CPU、IOPS、平均时延等指标,这些指标可以帮助管理员了解整个系统的运行情况,及时发现和解决问题。目前的企业级存储对性能监控相关功能都比较完善,不同厂商的存储在性能指标分析方面也具备图表展示能力,可以直观的观察到存储的实时运行情况。一些厂商也提供了一定期限的历史性能分析数据,可以帮助存储管理员来了解和掌握存储的性能情况。但是,想长期分析存储性能的话,可能需要借助存储厂商提供的存储底层命令或接口来抓取一些特定时间点的性能数据,在存储外部进行存储历史性能数据的分析。例如,每天定时采集一次当天的性能数据,以及每个卷组的空间使用情况、数据量等数据,汇总后可以人工分析。

(2)针对单个文件系统的性能指标进行设置也是非常有必要的。因为不同的文件系统可能会有不同的性能瓶颈,如果能够针对单个文件系统进行监控,就可以更加精确地定位问题,提高故障排除的效率。例如,如果某个文件系统的I/O负载很高,就需要及时调整存储策略或者增加存储容量,以避免影响业务的正常运行。不过,每家NAS品牌不一定都支持单文件系统性能监控,这需要根据具体的品牌和型号进行评估。如果NAS不支持单文件系统性能监控,可以通过其他手段来监控文件系统的性能,例如使用操作系统自带的性能监控工具或者第三方监控软件。另外,不少厂商也研发了存储管理平台产品,可以集中监控性能指标和管理存储等功能,有的产品对友商的异构存储也可以纳管。所以,可以根据自身实际情况来选择存储性能监控的方案。

4、如何快速分析NAS存储类基础设施对应用投入和产出分析?

针对基础设施投入和产出分析方面,目前对于给应用系统分配的资源情况进行梳理的效率还有待提升,如何实现快速分析存储资源投入和产出的方式?

想要快速分析NAS存储类基础设施对应用投入和产出,可以考虑以下几个方面:
(1)确定关键指标:首先需要确定关键的投入和产出指标,例如存储容量、存储性能、存储可靠性等。这些指标可以帮助我们更好地了解投入和产出的情况。通过对存储设备的容量进行规划,避免存储资源的浪费和不足。还可以根据应用系统的需求制定相应的存储资源分配策略,确保应用系统获得足够的存储资源,以提高应用系统的性能和存储资源的利用效率。
(2)数据采集和整理:对于银行行业中的NAS存储,需要对存储系统进行数据采集和整理,包括存储容量、使用率、性能指标(如带宽、IOPS、延迟等)等。这些数据可以通过存储设备自带的监控工具或第三方监控工具进行采集和整理。通过这些监控工具可以及时发现性能瓶颈和资源浪费的情况,进而采取相应措施。
(3)数据分析和可视化:通过对采集到的数据进行分析和可视化,可以更好地了解存储资源的投入和产出情况。例如,可以通过数据可视化工具绘制存储容量和使用率的趋势图,以及存储性能指标的分布图等。

(4)自动化分析和报告:为了提高效率,可以考虑使用自动化分析和报告工具。例如,可以使用脚本编写自动化分析程序,定期对存储系统进行分析,并生成报告。这样可以节省人力和时间成本,同时提高分析效率。

总之,针对银行行业中NAS存储的基础设施投入和产出分析,需要通过数据采集、分析和可视化等手段,了解存储资源的投入和产出情况,并通过自动化分析和报告工具提高效率。通过对存储资源的成本和效益进行分析,可以评估存储资源的价值和使用效果,以便更好地掌握存储资源的使用情况。例如:可将存储的采购成本、维护成本、规划使用年限、存储容量等进行量化换算,可以精确到1M或1G为单位的价格,可按日、月、年等维度计算应用系统所占资源价值,计算申请空间容量的价格和实际占用空间的价格,就可以帮助分析应用投入和产出,也可以提升精细化运营水平。

三、交流共识的总结:

(1)银行行业在使用NAS时,不仅需要制定使用规范通知应用,还需要采取一些有效的约束措施,以确保员工遵守规范,保障NAS的安全性和稳定性。

(2)银行行业日常加强对存储性能的监控,对网络负载情况、NAS负载情况、存储容量、控制器处理能力、吞吐量、IOPS等指标进行分析,若发现潜在性能问题时,有针对性的采取措施来规避风险隐患。同时,可以根据长期的监控数据分析总结出合适的QoS指标来提升存储的管控能力。

(3)银行行业NAS的性能监控需要关注整台NAS的CPU、IOPS、平均时延等指标,这些指标可以帮助管理员了解整个系统的运行情况,及时发现和解决问题,针对单个文件系统进行监控,可以更加精确地定位问题,提高故障排除的效率。

(4)针对银行行业中NAS存储的基础设施投入和产出分析,需要通过数据采集、分析和可视化等手段,了解存储资源的投入和产出情况,并通过自动化分析和报告工具提高效率。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

5

添加新评论0 条评论

Ctrl+Enter 发表

作者其他文章

相关文章

相关问题

相关资料

X社区推广