gaopin
作者gaopin·2015-05-14 10:01
产品经理·新云东方

瞧!IBM带给软件定义存储的“光”!

字数 6781阅读 1557评论 0赞 0

“我20年来都在IBM的硬件部门工作,从没见过硬件部门的发布会是以软件为主的,这是头一次。”在不久前IBM举行的一次存储新品发布会上,IBM大中华区硬件系统部存储系统总经理黄永志这样说到。而这次发布会上所介绍的新品就是IBM Spectrum Storage家族,中文的名字很闪亮——光谱存储家族。

      IBM光谱存储的发布之所以如此的特殊,根源在于它的定位——软件定义存储(SDS,Software Defined Storage)。提起“软件定义”,相信IT圈里的人都已经非常熟悉,这已经是一个公认的发展趋势。从最早的软件定义计算开始,人们就已经渐渐了解并熟悉了这一模式,想想服务器虚拟化就能清楚软件定义的基本要义与后续的发展路径。

      需要强调的是,软件定义的出现并非凭空想象,而是时代发展的必然产物。尤其是在互联网与应用结合得越来越紧密的今天,经营于互联网之上的企业也越来越多,基于云计算、大数据、社交、移动平台的新形态应用已经渐成主流,也因此像互联网那样的超大规模、超大容量、超级弹性的IT架构也正在成为企业IT所追求的。而传统的,围绕具体功能性硬件(比如计算、互联、存储、安全等功能)的垂直僵化架构,已经越来越不能满足这种需求,而将功能性硬件中的软件层抽离,以服务的形态部署于通用的硬件平台,以实现高度的灵活性(包括功能)、可扩展性与可管理性,几乎是必然的选择,“软件定义”也因此而生。

      而从一个综合的企业应用的角度来说,除了服务器外,还离不开网络与存储,它们是软件定义的平台基础,也是软件定义的对象。也因此源自服务器的“软件定义”,也在近几年名正言顺的进入了网络与存储领域,并大展身手。IBM光谱存储家族也正是在这一背景下应运而生,可以说它是当前所涵盖领域最为全面的SDS产品组合。

      什么是软件定义存储?

      不过在了解IBM光谱存储及具体组成之前,我想有必要对于SDS有一个初步的定义。对于这个于2013年开始流行起来的概念,业界有着不同的认识,就像当初对于服务器虚拟化以及后续演变而来的云计算一样,能否从一个全局的角度对其进行梳理和概括是帮助我们认清趋势的前提。这方面,著名的存储业界组织——网络存储工业协会(SNIA,Storage Network Industry Association)对SDS的特征与功能描述可能是最具权威的。

      在SNIA看来,SDS的主要特征如下:

      允许用户“自主创建”,用户可自主选择商用硬件,并通过所提供的软件自主创建解决方案。

      既支持通用硬件,也支持专用硬件的既有功能增强。

      适用于几乎所有横向扩展(存储,而不仅仅局限于纵向扩展的典型大存储柜。

      尽可能的存储与其他资源的池化

      存储和数据服务“解决方案”的递进建设。

      全局自动化管理

      为用户提供丰富的自助服务接口。

      通过允许标注元数据来驱动某类型存储和数据服务的形式,来提供一种服等级(SLA)的管理模式。刚开始时SLA的粒度可能较大,但随着时间推移,希望粒度更加精细。

      允许管理员设置存储和数据服务的管理策略。

      可以允许存储与数据服务的拥有者,通过基于“已认证存储用户”的退单模式(Chargeback Model)进行成本回收。

      支持存储和数据服务的解聚(Dis-Aggregation)。

      而SDS的必要功能需包括:

      自动化(Automation):便捷的全局自动化管理,降低存储基础架构运维成本。

      标准接口(Standard Interfaces):丰富的API接口,用于管理、供给和维护存储设备和服务。

      虚拟化数据路径(Virtualized Data Path):块存储、文件存储和对象存储接口支持应用写入。

      扩展性(Scalability):存储基础架构的无缝扩展,实现可靠性或性能的提升,(例如QoS和SLA设置)

      透明性(Transparency):用户对存储资源及成本耗费可进行公开透明的监控和管理。

 

      SNIA给出的SDS的全局愿景图


      在SNIA给出的SDS的全局愿景中,我们可以清楚的了解SDS的运作堆栈与流程,在底层通过存储管理平台接口聚合底层的物理存储平台(闪存、磁盘、传统存储柜等),提供存储服务,在其之上,则就是数据服务,它将“提炼”为相应的功能特征通过相应的API被管理员(分云、数据中心、存储、数据等不同管理层)所调用——面向不同的用户需求,进行基于策略的数据服务管理。而在数据服务层内部,所有资源均被池化,并根据SLA(比如金、银、铜级,不同和等级代表了服务质量)对外通过相应接口(比如SNIA所定义的云数据管理接口——CDMI)提供数据服务。

      IBM的软件定义存储——光谱存储

      与SNIA相对应的,IBM在2013年也提出了SDS的三个阶段,并在近几年进行了新的完善与更新,而文章开头所说的IBM光谱存储则可以认为是第二阶段的成果,并为进军第三阶段做好了准备。

 

IBM对SDS的三个阶段的定义,从某种角度上有点像服务器从虚拟化向云计算、全自动化负载优化的演进


      对于第一个阶段,想必已经不用多说了,就像服务器虚拟化是云计算的重要基础一样,存储虚拟化也是SDS的重要组成部分。而在第二个阶段,则对SDS的功能与能力进行了极大的丰富。从基本层面上来说,可以分成控制与数据两大部分。

      目前,SDS中的控制与数据平面的概念已经广受认可。所谓的控制平面就是指,在存储的范畴内对数据进行的操作处理,以提供相应的功能或服务,比如快照、复制、备份、自助服务、策略管理、分析优化等。而数据平面则是保证满足不同的数据存取的需求,比如虚拟化、横向扩展、归档存储等等。IBM光谱存储家族的6款产品组合,也由此可以分成两大部分。

 

      IBM光谱存储家族的组成与整体的应用堆栈,在IBM光谱存储下面就是物理硬件平台,可以是IBM自己的存储平台也可以是非IBM的商用服务器(即x86工业标准服务器)与存储介质,而6款产品组合加上底层的硬件平台


      首先看控制平面,成员有两个(按图中从左至右的顺序,下同):

      IBM Spectrum Control(监控):它源自于IBM的数据与存储管理解决方案,确切的说由两种方案——基于本地的IBM SmartCloud Virtual Storage Center(虚拟存储中心,VSC)与新近推出的,基于云的IBM Storage Insights,前者提供了强大的存储管理平台统一管理块、文件与对象存储,包括自动化的存储供给与分层优化,支持OpenStack与VMware环境,并提供应用感知快照管理。而IBM Storage Insights只需要在本地部署一台虚拟机,与一台IBM存储设备,即可获得基于云的存储管理方案,相当于云化的VSC,并能获得更好的体验,包括更好的容量规划、更高存储利率用、更合理的数据分布、增强的性能监控以及人性化的存储管理报告

      IBM Spectrum Protect(保护):基于原有的IBM 的备份与恢复解决方案,即著名的Tivoli Storage Manager家族。它为用户提供了备份与恢复的单点控制,让用户可以进行可靠的、可伸缩的高成本效益的备份,并能快速的恢复至虚拟、物理与云环境。在具体的操作中,数据删重与持续增量备份技术可以让虚拟与物理环境的备份存储需求降低95%,成本最多可节省38%。同时,基于策略的自动化数据管理解决方案,可以让数据自动的在闪存、磁盘与磁带介质中按需迁移以进一步达到最高的“性价比”,最后该方案还支持OpenStack Backup与VMware vCloud 集成。

      在数据平台,则有4款产品方案:

      IBM Spectrum Virtualize(虚拟化):源于著名的IBM SAN Volume Controller(SVC)。借助IBM强大的实时压缩功能(Real-time Compression),SVC在虚拟异构传统存储系统进行池化,方便用户在不同厂牌的存储系统间进行数据迁移而不影响应用的同时,还可以将存储容量等效提高最多5倍,并提升磁盘利用率达50%或更多。借助于IBM Spectrum Virtualize,光谱存储完成了对原有存储系统的“包容”,为尽可能的池化提供了有力的支撑。

      IBM Spectrum Accelerate(加速):这是光谱存储家族中最耀眼的一员,源于大名鼎鼎的IBM XIV存储系统,也是界业第一个基于已经被验证过的企业级存储技术的SDS解决方案——目前XIV技术已经稳定运行于全球超过10万台服务器之上。简单来说,它将XIV存储系统的软件“解耦”出来,让它可以部署在业界标准的x86服务器上,30分钟即可实现网格级(Grid-Scale)块存储的快速部署,并支持与公有云相结合的混合模式。在实际的应用中,IBM Spectrum Accelerate以虚拟机的形态(基于VMwre vShpere)运行,让用户建立起基于服务器内部存储的存储局域网(SAN,Storage area network)。从某种角度上讲,它相当于一个Server SAN,也因此天然具备了无热点的性能表现,提供了良好的负载均衡的能力。而且由于源自XIV,也天然具备企业级的存储能力,包括远程复制、多租户、快照、监控、安全与相关一系列的管理功能,并支持业界主流协同管理框架的上层调用,比如OpenStack与REST(表征状态转移)。

      借助 IBM Hyper-Scale Manager,IBM Spectrum Accelerate可扩展到多达 144 个虚拟阵列和超过 40 PB 的可用容量——每个虚拟阵列最多15个节点(服务器)x12块硬盘,可以最多扩展出144个虚拟阵列,按目前每块硬盘最大4TB计算,总可用容量将接近46.8PB(单个虚拟阵列的最高可用容量为325TB)

      IBM Spectrum Scale(扩展):源于IBM的经验证、可扩展且高性能的数据及文件管理解决方案——通用并行文件系统(GPFS,General Parallel File System),在IBM内部的代号则是“弹性存储”( Elastic Storage)。它是数据平面可实现高度横向扩展的重要基础,它支持数据的全局共享访问,拥有极致的可扩展性,可管理超过10亿PB级的非结构化数据,并具有闪存加速特性,确保极低的延迟。与此同时,IBM Spectrum Scale 还提供了强大的存储管理功能,配合基于策略的自动化管理,用户无需人工介入,即可完成对数据在不同层级存储间的迁移,从而可减少90%的存储成本,同时提高云、大数据和分析环境中的安全性和管理效率。 而且,IBM Spectrum Scale 还支持OpenStack Swift对象存储,可以让后者更女孩的管理图片、视频等对象。

      IBM Spectrum Archive(归档):已经不常用,但需要长期保留备案的数据,就需要归档处理了,这也是数据生命周期的最后阶段(再往后就是删除了),这些数据不需占用宝贵的闪存与磁盘存储的空间,此时最合适的介质就是磁带。IBM Spectrum Archive 源自于经典的IBM Linear Tape File System(线性磁带文件系统,LTFS),它能够自动将不常用的受访数据从磁盘移动到磁带,在保留易用性的同时减少成本,且无需专用的磁带应用。整体的操作均在一个易用的GUI界面下完成。IBM 提供了四个选件用于通过 LTFS 管理用户的数字文件:Single Drive Edition、Library Edition、Storage Manager 和 Enterprise Edition。其中,最高级的Enterprise Edition(企业版)支持全局的分层存储,可降低超过 50%的存储 TCO。

      软件定义存储之“光”

      从上文的介绍中,不难看出IBM的光谱存储正是沿着权威的SDS的概念前进的,与SNIA的愿景不谋而合。

      说到这里,不能不提光谱存储这个名字,IBM起这个名字显然是有深意的。通常来说,光谱(Spectrum)意指可见光的频谱组成,常见的彩虹即是一种典型的光谱展示,但它是由7种颜色的光组成(按波长从长到短分别是红、橙、黄、绿、蓝、靛、紫),从上文的光谱存储的完整堆栈中,可以看出6个光谱存储的产品组合,再加下底层的物理硬件平台,正好是7个元素,与可见光谱的7种颜色遥相呼应,从中也可以看出它们彼此之间紧密的逻辑关系。事实上,通过上文的介绍,我们应该能深刻感觉到这一点——虽然SDS分为控制与数据平面,但每款产品其实都有自己的“控制能力”并按照内在的逻辑彼此贯通、相互间有着紧密的联系,最终构成了基本的SDS平台。

      当然这种看似巧合的7对7的分析并不严谨,不过如果从光的角度延伸,则打开了广阔的想象空间——人类是不能离开光的,很难想象没有光的世界是怎样,因此光造就了人类的世界,如果我们把这个世界比做存储,如果它必然要向软件定义时代迈进,那么Spectrum Storage家族无疑就是IBM希望带给这个世界的一束光。

      然而,这远不是终点,就像现实中的世界,除了可见光之外,还有其他的光,就如浩瀚的宇宙一样,用光学天文望远镜只有看到冰山一角,这里还有γ射线、X射线、紫外线、红外线等等留给人们探测,只有完整的频谱,才能勾勒出真实的宇宙。事实上,从严谨的科学定义,所谓的光谱其实是包含了所有波长光的频谱。因此,可见的“光”只是我们认知SDS世界的开始而远未结束,我想这可能也IBM发布Spectrum Storage家族的深远用意吧……

      而IBM未来又将如何探索、认知未来的SDS世界,光谱存储家族又有着怎样的具体表现,就让我们静候即将在5月22日到来的“数据无界▪存储无疆—2015 IBM为大数据再造存储盛典”!

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

0

添加新评论0 条评论

Ctrl+Enter 发表

作者其他文章

相关文章

相关问题

相关资料

X社区推广