Jerry Miku
作者Jerry Miku·2023-08-10 16:44
其它·The Global 500

证券行业非核心交易系统超融合产品初选选型总结报告

字数 7331阅读 1069评论 1赞 9

课题背景:目前市场上的超融合解决方案品类繁多、良莠不齐,如何挑选出最符合企业现阶段需求的超融合产品,往往让企业决策者犯了难。以什么标准去选?以什么维度去丈量?以什么方式去标定?金融行业的业务规模大、起步快增速猛,什么样的超融合产品才能匹配业务的持续发展需求。金融行业的业务高可用及连续性要求高,还需要兼顾业务安全,这对超融合产品的稳定性以及管控功能都提出严峻的挑战。以证券行业为例,对于固收投研、网上交易、托管、资管这类非核心系统,网上交易及托管要求超融合产品能够实现低延迟IO,资管中分析型业务及数据库要求超融合产品的并发性能达标,同时面对行业监管,次核心系统的访问策略都需要精细化,对数据的保护也许根据业务及保留需求进行个性化定制……

为了让企业决策者们在超融合选型上作出准确的选择,启发产品选型的思路,twt社区“ 企业IT应用趋势项目创新联盟 ”超融合项目课题专家组织了本次《证券行业非核心交易系统超融合产品 初选选型评估》,以供各位同行参考。

一、 课题说明

一款产品的选型,对于企业来说往往是件费心费力的事,通过层层遴选,既要产品的功能足够丰富,解决现阶段面临的需求与问题,又要产品性能达标,支持起各类业务持续生产运营的健康运行。在金融行业,信息化人员在业务支撑和技术历练上的侧重并不相同,尤其是证券这种更聚焦业务的细分领域。对于超融合这类近年才崭露头角的技术产品,金融信息化人员很容易在超融合厂商的产品宣导与技术交流的持久战中渐渐模糊了选型的标尺,忘却了原始的初心。

本次超融合选型课题研究站在用户的视角展开,课题组收集了部分企业曾经的超融合选型的心路历程,以真实选型的思考为基本,从超融合产品的各个维度切入,在每个维度上通过功能描述、罗列主流指标等方式,辅助用户精细化选型的标尺,引导用户去迅速熟悉超融合的点和面,启发用户斟酌产品指标与信息需求的供需,最终收获满意的超融合产品。

二、 选型思路

超融合作为基础架构平台的主流解决方案之一,进行超融合产品选型的方法、维度以及手段千千万万,哪种思路更符合广大用户在进行超融合选型的心路历程呢?哪种思路对用户实际选型更有指导启发的意义呢?哪种思路更务实而不是让超融合选型流于形式呢?

首先,课题组选取了超融合的平台管理、架构特性、性能测试三个模块筹划选型思路。平台管理、架构特性、性能测试是逐级递进的 关系,对决策者的技术要求也是逐渐严苛。常规超融合选型过程中,平台管理和架构特性 的了解 多见于厂商的产品解决方案的交流中,通过产品主打PPT、案例分享的形式传递给用户。在这个沟通环节,厂商与用户双方沟通的视角位面受到专业技术与产品力等 不对称 的因素 影响, 既而 呈现“不对等”的局面,厂商往往因地制宜、扬长避短,主打产品的核心竞争力,用户若没有足够专业储备和产品阅历很难打破这种信息差带来的困境。为了彻底根除这种困境, 我们对“平台管理、架构特性”进行了全面拆解,每个纬度描述该 指标的功能、效力以及用户侧的收益,降低理解上手的难度,辅助用户迅速建立自己的标尺,同时我们也在重要的纬度引入了当前高性能架构已实现的能力表现,供用户选型时参考, 具体请参看下表 。

表1 超融合产品选型维度及指标

其次,平台管理、架构特性、性能测试三个模块,有的放矢,没有深入剖析“性能测试”这个模块。性能测试,一般处于超融合选型的末期,通常分为超融合基准性能测试和超融合业务基准测试。超融合基准性能测试,通常借助FIO这类测试工具进行3P1V和3P3V等基准测试。超融合业务基准测试,一般采用数据库性能测试代替,使用数据库基准测试工具 (如 SysBench ) 进行,通过测试数据库在不同业务模型情况下的数据表现,推测 各 业务模型下的理想性能。对于具备充足技术条件和测试资源的用户,也会选择部分真实业务部署到超融合上,通过业务压测脚本真实运行各种核心业务场景验证超融合的实际性能,最直观也最费时费力。从这部分的 测试 ,我们也不难发现性能测试带有相当严苛的数据表征,即使测试时投机取巧、开启部分隐藏参数特殊处理,也是要在超融合产品上实际的跑出匹配的性能数据,难以做到多场景真实数据互相印证(当然需要用户具备一部分专业实力发现数据无法印证的问题),难度相当大。基准性能测试手段,不仅有标准的测试流程,还拥有完备的数据解读规程,整个过程是一套几乎无法弄虚作假的标准化操作。因此在预期性能目标一定,超融合物理配置、测试手段既定的情况下,用户只需要给定物理配置明细、圈定测试工具和数据模型,监督测试执行,剩下的交给专业人士去完成即可。

最后, 课题组认为 一款优秀的产品的基本原则——轻松上手易管理、简单运营性能足、一键升级运行稳,在本次的选型分享中我们所有的维度、指标、场景也都是围绕这个基本原则展开设计。作为潜在用户,在对超融合选型的时候,始终要保持对原始需求的关注:需要什么功能、达到什么效果、满足什么场景,随着更多的产品交流与方案沟通,在各个选型维度上细化明确衡量的标尺、勿忘初心,达成需求与选型的契合平衡,才能挑选到满意的超融合产品。

三、 本次选型投票数据展示

本次超融合产品选型投票活动开始时间为 2023-06-19 ,结束时间为 2023-06-30 ,共计12 个自然日。

投票活动共开设2个主题板块、1 5 个维度的投票活动,第1- 8 个投票为超融合平台管理能力的选型投票,第9- 15 个投票为超融合平台架构特性的选型投票 ,最终投票数据整体如下 图 (绿色部分为每个维度前三):

图 1 超融合产品 选型投票数据汇总

在超融合平台管理能力的选型投票中,“超融合平台管理能力的选型投票”受到广大参与者的密切关注,收获约100人次的投票,投票结果为: VMware vSAN 31.2 %、 Nutanix HCI 20.4 %、 SmartX SMTX OS 与华为 FusionCube 并列 16.1 %。从投票的结果我们可以看出:作为全球虚拟化市场的王者V M ware vsphere 凭借超高的市场占用率以及原生集成 VMware vSAN 的优势,成为了主流超融合解决方案的TOP之一,成绩不俗。作为专注于超融合的 Nutanix HCI , Nutanix HCI 优异的性能表现给不少用户留下了深刻的印象。 不仅如此, Nutanix HCI 所有功能以模块或插件的形式几乎无缝集成在控制台中,实际使用感受相当丝滑。作为国产超融合产品的代表之一, SmartX SMTX OS 与华为 FusionCube 也交上了不错的答卷。 SmartX 始终坚持Make IT Simple ,同时也将这一理念深 深 入 融合进了 SMTX OS 中 并维持着更新迭代的高频率 ,已经步入了 SMTX OS 5. x的时代。在 SMTX OS 超融合中,用户经过简单培训即可轻松上手,标准专业的售后团队堪称行业清流 ,无论技术人员的专业水平还是文档报告 编制能力 都在第一梯队 ,受到不少客户的称赞。华为自 2 018 年前后对产品线大刀阔斧改革精简,集中 Fusion 家族众家之所长的 FusionCube 也开始了强有力的催化,虚拟化层的 Fusions phere、存储层的 Fusions torage、管理层的Manage ONE 凭借着各自强大的产品力,合力浇筑了 FusionCube 的护城河。

在超融合平台架构特性主题的投票上,整体投票数据均匀分布,没有 呈现出用户 特别关注或特别突出的板块,这也侧面反应出用户对于超融合的架构特性的关注,不分彼此。在投票数据结果上,仍是 VMware vSAN 、 Nutanix HCI 、 SmartX SMTX OS 与华为 FusionCube 靠前。 Nutanix HCI 与 SmartX SMTX OS 的技术路线相似,采用自研超融合架构,在架构特性上各有亮点。 VMware vSAN 则是依靠与 VMware vsphere 的原生集成,迅速打开市场格局。华为 FusionCube 作为 Fusion 系列的集大成者,融合了 FusionCompute 与 FusionStorage 的技术优势,快速开拓了 FusionCube 的市场,技术融合的线路需要勇气也需要实力去持续注入,期待 FusionCube 的表现。

对于超融合平台的技术架构,我们按照从虚拟化层到硬件层、自上而下来看,分别是虚拟化软件应用、超融合管理控制应用层、超融合分布式存储应用层、服务器硬件层。在虚拟化软件应用的支持上,各家超融合产品兼容度已大相径庭,主流虚拟化软件均已支持,侵入性部署的问题、高级特性的集成联动就见仁见智了。接下来就是超融合管理控制应用层和分布式存储应用层了,这一整套也就是我们通常说的“超融合”。超融合管理控制应用是超融合的核心,它管理、调度、利用整个超融合元数据,对上可至与虚拟化软件层的边际通讯,对下可达服务器硬件(如SSD)。超融合元数据的管理是超融合尖端技术核心,抛开复杂的技术分析,我们结合本期投票纬度来简要说明。IO路径优化、链路冗余是和虚拟化软件层边际通讯的典型(当然也一直贯穿至超融合分布式),通常由超融合的技术架构决定,比如在 Nutanix HCI 里从 Hypervisor 到 Acropolis DSF 的IO大部分通过CVM来决策,不同类型IO都有各自的下发 策略 。此部分设计的优劣将很大程度在POC的3P 1 V测试结果中放大。如果说IO路径优化是超融合性能的台柱子,那链路冗余就是极端情况(如超融合单节点故障)下IO可靠的保障。对超融合稳定性及性能特别关注的用户,需要重点考量此部分指标。线性扩容、存储策略优化、磁盘平衡、快照克隆则多是基于分布式存储的实现 。 存储策略、磁盘平衡以及快照克隆,存储策略决定了虚拟机数据在分布式存储池的平衡分布(但会尽可能在虚拟机节点保留一份完整数据加速IO),磁盘平衡则是打破本地亲和性带来的局部化问题,平衡分布式存储池的容量。在超融合中,快照克隆虽然发起者是在Hypervisor ,但多通过插件或者其他能力去调用分布式存储能力,结合超融合元数据能力实现极速快照克隆。对于超融合容量需求高的用户可以密切关注这两部分的指标。线性扩容是超融合的核心亮点之一,各厂商的差异性主要体现在线性扩容的隐性限制上,如新增节点与已有节点在CPU、内存、磁盘等规格上的差异,CPU的代数问题、SSD的品牌问题、内存的频率问题等等,限制越少越优异。对于超融合节点数需求高的用户可以重点关注,毕竟每隔两三年服务器三大件 都会频繁更新迭代 。

四、 超融合选型的综合建议

超融合适用场景建议

根据Gartner 在2021 年发布的《 Critical Capabilities for Hyperconverged Infrastructure 》(超融合基础设施的关键能力)报告,超融合产品适用的场景包括如下六大类:

  1. Consolidated:以降低 TCO 为目标的不同层级 IT 设施整合的数据中心超融合项目。

随着数字化转型的进程, 企业由传统IT架构(服务器+存储+网络设备)向HCI ( 超融合 ) 架构的转型 。 相比传统IT架构,HCI的成本优势非常明显 , 单项目 TCO成本预计降低3 0 %以上。

  1. Business-Critical:关键业务应用。

主要 用于 支撑企业生产 关键业务, 通过超融合的分布式架构与灵活扩展的特性,全面 提升 各业务的 可靠性与可扩展性。

  1. Cloud:云原生 支撑 。

作为云底座,超融合也是一个非常不错的选择。 超融合的 最小节点起步、在线动态扩展的特性,结合云架构的按量付费模式,能够进一步 降低云 建设的起步成本,优化资金的投资回报效率。 同时超融合线性扩容的优势, 也能与 云高并发 、 高性能的架构特性 相辅相成。

  1. Edge:边缘计算。

边缘计算这个场景在金融行业不太感冒,但对于零售、建筑等其他行业则比较突出。超融合最小节点起步的优势就发挥出来了,部署交付快,计算存储一体,运营简单。

  1. ROBO:远程分支办公室场景。

ROBO的场景除了办公以外还 涵盖分支业务的场景, 超融合可利用其最小化节点部署解决分支机构机房空间小、运维能力不足的困境, 同时多集群管理能力也能够实现总部-分支的纳管, 协助分支单位进行 标准化的统一 运维 管理。

  1. VDI:虚拟化桌面应用。

超融合的高并发和线性扩容特性能够很好的搭配VDI场景的解决方案, 虚拟终端由少至多, 解决集中式架构带来的启动风暴问题。超融合带来的TOC成本下降优势,用户也能 通过 VDI+ 超融合简化部署而受益。

以上六个是超融合适用的典型 场景,任何解决方案都有一定的局限性,超融合也不例外 。在企业超融合大环境的 持续 建设中,我们通常会遇到 如 以下 三 类 业务场景 不 宜使用超融合的 :

1,计算存储不对等的业务

超融合的整体性能与资源 是 通过节点的线性扩容实现,因此不能通过扩容解决问题的场景就不适合超融合方案了。 例如一些存储海量的文件、图片或视频等非结构化数据的业务系统,它的计算资源和存储资源需求并不对等,存储资源需求可能是爆炸性增长的,而计算资源增长的需求几乎没有。

2,依赖物理化部署的业务

超融合产品上层依托的是虚拟化, 不适合虚拟机部署的应用将不适合采用超融合方案。例如 部分 应用重度依赖物理服务器单节点性能 上限或者“不能 /不建议 ” 进行虚拟化部署的业务 ,如精算软件及模型 计算高度依赖单核高主频CPU及内存的计算速度 。

3,分布式及虚拟化嵌套问题

超融合产品底层为 分布式架构,通过副本技术实现数据冗余。若是业务 应用 技术栈本身就是分布式架构,再 超融合分布式架构的 嵌套 ,就会 造成 计算和存储的双重 损失。 嵌套虚拟化同理。 例如 基于 Greenplum 的分析型业务,虽然超融合 分布式 带来高性能高并发的优势 能够 提高 Greenplum 的计算效率 ,但存储经过两层分布式嵌套 ( Greenplum 数据 分布式存储+超融合分布式架构及副本 ) , 存储 需求量呈倍数增长,整体收益大幅降低。

超融合产品选型建议**

对于超融合产品选型的建议,我们通常建议用户从两部分出发,一部分是超融合项目建设需求,另一部分则是超融合产品的功能选型的侧重。

超融合项目建设需求,很大程度决定了超融合产品在今后使用上的定位:作为新技术的探索尝试?还是作为传统架构的替代过渡?亦或是通过超融合解决一些特殊的需求?

纵观全球超融合市场格局,以 Nutanix HCI 、 VMware vSAN 为代表的国际厂商起步较早,在市场的磨砺中核心产品力相对强势,生态打造齐备,若是在生产环境进行架构升级迭代,我们推荐用户考虑。在我们调研的客户反馈中,不少客户均称赞 Nutanix HCI 的Prism控制台设计的标杆示范,统管全局,各功能界面仅通过一级最多两级交互便可实现,体验相当友好。VMware vSAN 与 VMware v s phere 的集成度也相当高, VMware v s phere 部署完后简单配置即可开启 vSAN ,省去了冗长的配置流程,功能互动也相当智能,体验良好。即使国际厂商凭借着先入为主的优势席卷市场,国内超融合厂商也在 奋起直追 。从2 020 年以来, Gartner 多次报道国内超融合产品有目共睹的进步,如华为 FusionCube 、 SmartX SMTX OS 、 QingCloud 青立方QING³ 、深信服 aCloud 等。正如此前我们提及华为 FusionCube 的产品力、 SmartX SMTX OS 的专业服务等,都是可圈可点的地方。在超融合产品上做技术探索或者想在生产环境尝试新平台的用户,也可以将国产超融合产品纳入考虑范围。

解决超融合项目建设需求之后,超融合产品功能选型的侧重也很重要。在实际与超融合用户沟通的过程中,我们也发现一部分客户反馈IT部门较薄弱,对超融合平台的性能要求没那么严苛,反 而 倒 对超融合的稳定性和易用性要求高,不用耗费过多的精力运营超融合平台。类似这种情况,则需要对照超融合产品选型的纬度逐一分析,哪些功能是符合当前企业实践的?哪些特性是 可以 不太关注的? 在超融合产品功能上, 常规的功能(如: 平台管理维度15 - 1 ~ 6 和 架构 维度15- 9/10/13/15 ) 的使用成本低、轻松上手,对于信息技术薄弱的企业非常友好 ,无须了解复杂的产品架构及技术文档即可完成日常基础运营需要。 超融合的高级特性(如平台管理维度15-7/8 和 架构维度15-11/12/14 ) 是衡量超融合产品优劣的标尺 ,也是用户在选型时需要进行抉择的 功能池 , 每一款产品都不可能尽善尽美, Nutanix HCI 强在性能、功能、生态的均衡 ; VMware vSAN 胜在原生集成的优势 ; SmartX SMTX OS 积蓄 着 产品迭代 、功能演进与性能释放 ,秉承 高质量服务 稳扎稳打;FusionCube 依仗强势的产品力融合及品牌口碑也赢得了不少用户…… 。 选型出一款好的超融合产品固然重要,也要兼顾企业生产运营实际。相比于超融合的卓越性能,完整高水平的企业级服务支持或是更好的选择。

最后,关于本次投票选型的超融合产品TOP4在用户真实环境运营的心声,课题组做了一个产品集合供大家选型时参考,同时也欢迎有超融合运营经验的朋友们一起分享使用感受。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

9

添加新评论1 条评论

csj11341csj11341项目经理北明
2023-08-14 13:47
挺好的材料
Ctrl+Enter 发表

作者其他文章

趋势联盟联盟文章

相关文章

相关问题

相关资料

X社区推广