作者·2012-02-06 13:34
·

水流云在—从云计算到云存储

字数 3916阅读 3629评论 0赞 0

水流云在从云计算到云存储

--IBM云存储专家冯宽谈存储技术在云环境中的发展

                                                                          程鸿/文

2011年人们对于云计算的听闻都已经感到疲惫了,而对于云如何落地的讨论也是越来越广泛,而在谈到云落地问题时我们究竟要考虑哪些环节?怎样才意味着云真的落地了,哪些技术的应用对于云的落地至关重要?云存储是否会为云落地提供先机呢?

 

云将如何“落地”

IBM云存储系统专家冯宽认为,云落地可以按照这样的思路来考虑:云计算/云存储主要为了解决什么问题;云计算/云存储如何解决这些问题;云计算/云存储技术如何实现。
   
需要解决的问题:
   
简单来说,特别是针对存储,主要的问题就是迅猛扩张的数据量和用于IT设施建设的预算之间的矛盾。之前,解决这个矛盾的主要方法是摩尔定律作用下的IT设备技术自身的发展,对于存储而言,直接的例子就是不断增加的单位存储容量,最早的硬盘以M为单位,现在以T为单位。同样的资金投入,获得的存储容量MT,一百万倍的进步。但是随着信息量的暴增,设备技术本身的发展速度越来越落后于信息产生的速度。于是,需要进一步研究解决这一矛盾的方法。
   
如何解决问题:
   
除了存储本身发展之外,还可以研究的方向就是提高存储效率。事实上不少存储的资源被浪费了。浪费的种类包括,闲置的存储空间,重复的存储内容,不必要的投入等等。要解决这些问题,首先要做的就是对自身的存储状况有一个统一的管理,集中的了解,然后把浪费了的资源更有效地利用起来。
   
怎样实现云存储:
   
建立大的统一的存储池,对资源的分配和管理实现自动化以及相应的优化,在此之上提供自助式的服务,这就是构建一个存储云的过程,也是让存储云落地的一个途径。
统一的存储池是一个重要的条件,是进行下一步优化的基础。建立了统一的虚拟的存储池之后能够更好地利用分散在各个存储设备上的闲置空间,能够更有效地进行重复数据删除。在统一的存储池上分层也能够更有效地提高高端设备的利用率。有了统一的存储池之后,在它之上提供管理以及自助服务,都变得顺理成章。
   
在云存储里面我们说存储池,对于云计算,这就是资源池。云存储和云计算在本质上是相同的,都是为了将资源虚拟化集中化,当作服务通过网络提供给用户(请参考NIST云计算定义)。建立统一的存储池技术后,我们可以找到很实际产品来支持,比如IBMSVC等,随着越来越多产品的支撑,存储云的落地之路就越来越清晰。

 

云应用正在推进

云存储和云计算一样,都是把IT资源集中化虚拟化成为资源池,通过网络以服务的形式提供给用户。对于用户而言,云存储就是一系列存储服务,但对于服务提供商而言,需要大规模的由实物组成的存储系统来实现,随着新产品的不断推出,云存储的前景会越来越清晰。

谈到云存储的应用国外最典型的应用就是亚马逊的云架构,另外在欧美有不少大学建立了自己的云培训架构,云服务对于教师和学生又会提供一种公共的云服务,而关键部分则采用私有云模式,因而是一种混合云。国内目前国内还较少,但也有许多网络企业开始部分地提供这种服务,如阿里巴巴、盛大等企业都在尝试一些云服务模式。IBM公司中国实验室也建立了名为“round  Cloud”的云服务的平台,另外IBM全球也建立了“research cloud”云平台,用于计算资源的共享。
云存储的市场潜力可以从它所解决的问题是否紧迫是否重要以及是否有效来考虑。相信随着时间的发展,爆炸式的增加的信息量和有限的IT经费之间的矛盾会越来越突出。利用云计算/云存储的方式来解决也会越来越普遍。随着云存储的普及,存储设备的利用率得到了有效得提高之后,就会再度需要新技术来解决这个矛盾。

热门存储技术何去何从?

近期,AIX专家社区针对当前热门存储技术在云环境下的将会如何发展,是否会有某种技术将不再被使用或使用频率降低等问题进行了调研投票,结果显示当前的一些热门存储技术,如SAN、集群NASSSD、数据压缩、自动分层、重复数据删除等技术在云存储环境中的状态将发生变化(如下图所示)。

 

 

图:热门存储技术在云中的角色定位

 

其中,认为在云环境下最重要的技术是重复数据删除和SAN,分别占29.63%25.93%;其次,16.67%的用户看好集群NAS,而被认可度最低的是SSD。针对这一问题,冯宽认为SANStorage Area Network)、ETH Ethernet)、IBInfiniband)、PCIE:PCI-Express)、NASNetwork Attached Storage)、SSDSolid State Disk)、SVCSAN Volume Controller)等设备之间的连接技术未来发展与云存储之间的关系,主要是集中在如何能够让云存储池中的数据信息更快速地被外部的计算设备访问到。
   
对于当前一些热门存储技术在云环境下的发展,冯宽指出,事实上SSD等新兴存储技术是可以从云计算中获得很大收益的。新兴技术所带来的某个方向上的突破,通常都受到成本方面的制约,只有充分发挥该新技术所带来的效益之后才能吸引到更多的应用。而云存储带来的大平台,通过自动分层等相关技术,可以帮助像SSD这样的新兴技术找到最合适的数据及应用,从而进一步推广普及新技术,给SSD带来更多发展的机会。

此外,NAS所主要提供的基于文件的存储访问方式相对于基于块的访问方式而言,更加适合存放非结构化数据,因此在构建新的主要面向非结构化数据的存储系统时候NAS系统会是首要考虑的对象。而各种调研数据均表明未来信息扩张的主要向是非结构化数据,因此在新建存储系统中多会考虑NAS

   
而集群NAS主要解决的问题是NAS存储的横向扩展问题,目标也是为了构建大的存储池,从而提高存储利用效率,这本身和云存储的方向是一致的。为了应对文件类型数据的爆炸式增长,增加新存储系统时,集群NAS成为越来越重要的考虑因素。

在谈到数据压缩、自动分层、重复数据删除这一类技术的前景时,冯宽认为用户的目标都是为了更有效地利用现有的存储资源,云存储推动下的统一的资源池的建立为这些技术提供了更大的发展平台。数据压缩在云环境下有一些特殊性,针对某一个应用领域需要一些细分的压缩技术;自动分层带来的好处是“好钢用在刀忍上”,也就是把最好的资源用在最需要的地方,云的资源池并不是统一的,也会分为不同的服务等级,因此分层技术会更有效,而重复数据删除技术在大的应用系统中也将会发挥更大的作用。

部署云存储时要明白的几件事
   
据冯宽介绍,企业在部署云存储系统时不能盲目,需要搞明白几件事情。首先,云存储主要解决的问题是数据量的增长和有限的投入之间的矛盾,如果现有的设备和IT预算完全能够满足自身的业务需求,并且在一定的时期未来也没有矛盾,那云存储带来的主要优势就没有了,当然,集中之后仍然可以简化管理了。
   
其次,和云计算一样,云存储的主要目标是提高存储设备的使用效率,如果现有的环境对于资源的使用已经非常高效,那就需要从别的方面来寻找更好解决方案。此外,一些特殊的业务要求(比如和存储资源的物理位置信息结合非常紧密地应用)也可能会阻碍云存储的推广。总之,不是所有的问题都可以用云存储来解决,需要从实际出发。

最后,在谈到一些云的认识误区时,冯宽解释说,目前有些人在谈云计算方法时经常会是将Hadoop架构作为一个重点的研究方向,但实际上Hadoop一个分布式系统基础架构,由Apache基金会开发,用户可以在不了解分布式底层细节的情况下,开发分布式程序,Hadoop的宗旨是为了帮助用户在一个大数据量的场景下进行更有效计算。而IBM对云的定义是如何把IT架构变成服务,为企业提供更好的资源利用率。事实上,Hadoop与云计算是不同层面的概念,云计算是管理层面的概念,而Hadoop则是应用层的概念,这一点需要进行澄清。

 

注:本文被收录在《存储架构师》杂志第六期

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

0

添加新评论0 条评论

Ctrl+Enter 发表

作者其他文章

X社区推广