张冬林
作者张冬林2016-11-15 14:09
存储架构师, 中国电子口岸

安全成为企业存储选型过程中的重中之重

字数 2385阅读 4358评论 0赞 0

影响存储选型的几个关键指标: 数据类型、技术路线、成熟稳定、安全、成本、性能、功能、存储虚拟化

数据类型:我们丰富的应用系统产生了多种多样的数据,这些数据大体上可以分为三类:结构化数据、非结构化数据和半结构化数据,知道了要我们要存储的数据类型,下一步就是确定技术路线。

技术路线:存储同一类型的数据也可以有不同的技术路线,比如针对海量非结构化数据的存储和处理,我们的通关无纸化系统每年将产生6亿多个文件,数据每年增长近60TB,在开始调研阶段就有4条技术路线:1、开源的分布式文件系统加二次开发;2、基于hadoop的分布式计算加分布式数据存储;3、选用成熟的内容管理系统;4、可横向扩展的集群NAS设备。从各方面考虑,我们最终选择了可横向扩展的集群NAS产品,目前还在招投标阶段。

现在市面上存在两种类型的存储设备:基于san的块级存储和基于NAS的文件级存储,随着技术的发展在中低端存储领域,NAS和SAN存储逐渐融合形成现在的统一存储,但在高端领域两者还是有明显的区别。

安全:狭义的数据安全:那么就像前面提到的众多知名品牌都采取了各种软硬件技术保证数据安全,这里就不再过多阐述。广义的信息安全:这个就像最近媒体上经常提及的手机用户资料被厂商在后台收集一样,作为关键数据支撑的存储系统同样面临同样的问题,国家安全战略安全也是非常重视,因此大力发展国内厂商自主产品的发展,我查了下关于“去IOE”的新闻,好像这一提法最早来自工信部,最先开始执行的是阿里巴巴,当然这里安全和成本的因素都有,不管怎样,这将对以后的存储设备选型产生重要影响。

成熟稳定:一般会选择在业内积累树立了一定口碑的,有多年市场推广和应用经验的国内外知名品牌,而且其产品对现有应用系统有很好的兼容性,我们基本不会应用最新的产品,而是要求其发布时间至少在一年以上。

性能:SAN存储的2个评价指标:IOPS和带宽(throughput),两个指标互

相独立又相互关联,在不同的应用方式中,需要考察的侧重点也不同,

但体现存储系统性能的最主要指标是IOPS。

IOPS:存储的IOPS取决于Cache命中率和磁盘个数,通常OLTP应用涉及更多的频繁读写,更多的考虑IOPS。IOPS测试方式: 100%顺序读(SequentialRead)IOPS、100%顺序写IOPS、100%随机读IOPS、100%随机写IOPS等,在同等情况下这四种IOPS中100%顺序读的IOPS最高。较权威的存储性能基准测试:SPC的SPC-1基准测试主要是针对随机I/O应用环境的,SPC-2基准测试主要是针对顺序I/O应用环境的。

带宽(throughput):存储系统的带宽主要取决于阵列的架构、光纤通道的大小、硬盘的个数等,一些大量的顺序文件访问,例如流媒体、测绘等大文件连续读写的环境下,性能主要由带宽决定。

对NAS产品来说,也有两个重要性能指标:

  • OPS:每秒有多少个操作,是并发能力的指标。
  • ORT:表示客户得到服务响应的快慢,单位是毫秒,这个数值越小越好。

较为权威的性能基准测试:SPEC SFS

现在说一下固态盘的使用:

我最早接触固态盘大概是在2011年,当时我们做了一次存储系统的切换,将数据库存储系统由IBM DS8000切换到EMC DMX4,切换完成后磁盘异常繁忙,系统几乎无法提供服务,事后通过对比发现DMX4的磁盘不及DS8000的一半,EMC的分析结论也是增加磁盘的数量或者采用固态盘,后来我们采用了固态盘的方式,在DMX4上新增了十几块固态盘,问题得到了解决。

现在随着技术的进步、市场应用的成熟和硬件成本的下降,未来全闪存阵列(后端的盘全都是固态盘,没有机械硬盘)将会被广泛采用,这将极大提高块存储的I/O性能,目前业界已有10多种全闪存存储。应用在服务器里现在也可以配置固态盘,像我们平时观察系统的I/O,会发现操作系统所在的磁盘的I/O繁忙率很高,以前可以通过关闭一些高级功能和采用操作系统(unix)分散安装在多个磁盘上的方式,来分散I/O的压力,如果采用固态盘安装操作系统和应用软件,将显著提高物理服务器操作系统和应用的运行效率。关于全闪存存储技术的发展我们找时间可以继续讨论。

成本:采购维护成本:应用项目保障级别、访问时效性、数据规模、设备生命周期等要求决定了存储的配置规模和档次,也就决定了相应的采购维护成本。附加成本:在做存储规划和选型时,我们更倾向于要考虑已在使用的品牌,这源于我们对技术投入和学习时间成本的考虑,同样还要考虑容灾和备份的需要。

功能:现在存储上有多种新的功能,这里说说我们在调研和使用过程用到较多的几种功能:自动配置管理(Auto Provisioning):Auto Provisioning是EMC提供的一种新的主机到存储阵列的磁盘访问机制,相比传统的配置方式,新的方式将大大减轻配置的工作量。精简配置:通过使用磁盘精简配置提高存储容量的利用率,这个在虚拟机和存储虚拟化设备上得到了很好的使用。分级存储:通过将不经常访问的数据自动移到存储层次中较低的层次,释放出较高成本的存储空间给更频繁访问的数据,可以获得更好的性价比。

存储虚拟化

存储虚拟化在有些厂商的产品里也可以算做一种功能,但因其表现形式多样,这里单独提一下:存储虚拟化主要指SAN存储的虚拟化,通过存储虚拟化建立存储资源池,解决存储异构问题,提高存储容量利用率,简化存储的配置操作,现在我们在开发测试环境部署了IBM的存储虚拟化设备,构建了基于异构存储的存储资源池,为将来基础架构云的实施做了铺垫,相信存储虚拟化会有更好的发展前景。

综上,我们梳理了以上几个存储选型的因素,在这几个因素中,技术路线是方向,方向对了后面的选型就会比较清晰,在其他几个因素中,我认为安全是最重要的,往后依次是成熟稳定、性能、成本、功能。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

0

添加新评论0 条评论

Ctrl+Enter 发表

本文隶属于专栏

最佳实践
不同的领域,都有先行者,实践者,用他们的最佳实践来加速更多企业的建设项目落地。

作者其他文章

相关文章

相关问题

相关资料

X社区推广