lidexin
作者lidexin2020-12-02 15:27
系统架构师, 浪潮商用机器有限公司

xx金融公司对象存储平台案例分享

字数 2554阅读 3120评论 0赞 4

1. 现有架构

影像资料电子化是指以先进的影像管理技术为基础,配合相关的系统硬件,将纸面的资料转换成电子影像文件,并实现自动建立索引、查询、查阅和存储等功能的一整套技术方案。通过实现影像资料管理电子化,一方面可以提高管理效率、降低管理成本,日常维护和管理仅需要较少的几个人员即可满足需要;另一方面还可以提高信息利用率。无论是远程、异地查询,还是多人信息共享,都可以从容实现,最大程度的实现信息资源的价值。

在日常业务中,该公司每天会产生大量的影像资料,包括保单、理赔申请、病例信息、诊疗影像、车损物损影像、发票信息等,对于这些影像资料,如何进行分类、保存、归档和进行高效的查询,一直是一件棘手的事情。很久以前,多数公司对上述影像资料的管理停留在“人工分散处理 + 纸质库房保存 + 人工查询”的阶段,而后进入到了电子影像的管理阶段。

目前,客户现采用的是 NAS 存储阵列存储四套系统的影像数据,涉及保险业务的开户、电子保单、理赔等业务系统,数据量约为 300TB 。随着互联网业务的蓬勃发展,其数据量增长较快,原 NAS 系统已经无法承担其重要系统。

2. 系统规划


软件定义存储的扩展性与敏捷性更好的帮助用户 IT 双模架构的转变与应用创新;丰富的企业级存储数据保护特性及安全可靠性降低了客户在数据保护方面的额外投入;易用性方面极大的降低了存储运维与管理方面的复杂度,实现了存储硬件标准化、管理运维统一化的理念,以低成本提供更高效率的存储服务,在大数据时代获取更大的价值;通过架构的灵活性、弹性能力最终不断有效驱动业务的良性、快速发展。

在本次项目中,我们采用 Inspur K1 Power Linux 服务器作为对象存储系统服务器, XSKY 作为上层对象存储软件构建一体化影像系统对象存储改造。

通过前期规划,我们将在三个跨省的数据中心上建立起一套跨三地的三套基于 XSKY + Inspur K1 Power Linux 的对象存储集群。其中, A 地和 B 地分别各自作为 2 套生产业务系统的生产影像存储平台,并相互作为灾备中心。同时, C 地数据中心作为第二灾备数据中心,即灾备顺序为,当 A 地数据中心发生灾备时,由 B 地数据中心对象存储系统进行接管,若 B 地数据中心也发生灾备时,由 C 地数据中心对象存储系统进行接管;同样,当 B 地数据中心发生灾备时,由 A 地数据中心对象存储系统进行接管,若 A 地数据中心也发生灾备时,由 C 地数据中心对象存储系统进行接管。

在每个数据中心本地,每套集群设计部署 8 个 XSKY + Inspur K1 Power Linux 分布式对象存储节点,数据保护策略采用 EC ( 4+2 )纠删码方案,满足集群中 2 个节点同时发生宕机时,集群的存储数据仍然完整,业务服务不中断。

每一个 XSKY + Inspur K1 Power Linux 分布式对象存储节点配置 2 块 480GB 的 SSD 用于存储节点的系统盘;配置 2 块 960GB 的 SSD 盘用于该节点的数据缓存盘;配置的 10 块 12TB 的 SATA 盘用于对象数据的存储,每节点提供 120TB 裸容量,单套集群则提供 129TB × 8=960TB 裸容量,单套集群提供可用容量约为 960TB × 4/ ( 4+2 )× 0.9 ( 修正系数 )=576TB ,满足项目规划设计,且可按需随时增加节点进行集群的水平扩容升级。

在分布式存储系统中,对网络的配置要求是高性能(高带宽低延时)、高可靠(网络高可用)

高性能低延迟冗余网络架构进行存储集群组网

分布式存储系统网络最佳实践:**

交换机堆叠配置为高可用冗余网络架构;

存储节点网络连线进行绑定配置,以实现节点的网络链路冗余;

存储集群内联网、集群业务网、集群管理网三网分离部署;

存储集群子网进行合理规划设计,为后续扩容保留适量地址;

存储节点推荐启用 IPMI/BNC 的带外管理网络,便于运维管理;

分布式存储网络解释

Admin Network: (1Gb) 管理网络,用户通过该网络管理和配置访问集群与各节点;

Public Network: (10Gb) 存储集群对外业务网络,存储客户端可通过该网络访问到存储池(业务网络与网关网络常规划为相同子网);

Cluster Network: (10Gb) 存储集群内联网络,用于集群各节点之间 OSD 监控、数据同步等;

分布式存储系统支持万兆高速网络,三种类型的网络数据流:

客户端对存储系统的读写访问等前端数据流,即集群业务网使用 10GE 网络;

存储节点间的数据传输、同步、重构、迁移等后端数据流,即集群内联网使用 10GE 网络;

存储系统的控制信息数据流,即存储管理网可使用 1GE 网络;

条件容许的情况下,分布式存储系统建议将上述三种不同类型的网络规划独立网段来隔离部署,同时也可以灵活的支持网络复用。(如,在 POC 场景中常将集群业务网与集群内联网合并共用相同物理端口,不独立设计以减少对用户万兆网络端口数量的要求)。

3. 配置规划

名称版本描述数量
CentOS7.6Linux操作系统24(节点/套)
X-EOSv4XSKY分布式对象存储系统授权3(套/集群)
浪潮K1 Power FP5280G2服务器 2颗Power9 2.2GHz 16核CPU, 8*16GB DDR4 RDIMM 2666MHz内存, 2块480GB SSD硬盘, 2块960GB SSD硬盘, 10块12TB 7.2k SATA硬盘, 2块双口10G光口网卡, 集成2个1G电口, 冗余电源24(套)

4. 项目收益

通过此次项目我们将影像数据内容管理平台的大数据存储层由 NAS 网络文件系统改为了对象存储平台,最终将获得以下收益:

  • 充分发挥了对象存储具有分布式存储灵活的拓展性特点,在数据存储量不足时,直接在线增加存储节点,实现容量的横向扩展;
  • 在性能和灵活性方面,对象存储由于其可横向动态扩展节点的优势,即可整体增加影像系统存储性能,也可节省不小的存储成本,避免了资源浪费。
  • 通过对象存储的 RESTful 接口与影像管理平台相结合,提供了定制化存储系统,使应用层访问存储层更为直接。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

4

添加新评论0 条评论

Ctrl+Enter 发表

作者其他文章

相关文章

相关问题

相关资料

X社区推广