某金融行业使用华为高端存储的应用实践经验之测试和数据迁移篇
摘要:
本文主要描述了某保险公司为了替换之前过保存储设备来保证核心系统的安全性,扩容当前存储池为项目背景,经过硬件及性能测试后最终选择华为OceanStor 18000 系列高端全闪存储,并利用华为存储高端特性异构虚拟化的技术迁移原理完美的实现数据库后端存储从其它存储平台上无缝迁移到华为高端存储。希望能对同业带来参考。
全文共分为三个部分:需求分析及设备选型思路篇、测试和数据迁移篇、选型经验和效果篇;本文为第二部分测试和数据迁移篇。
一.设备测试
本次存储测试主要分为存储硬件测试以及性能测试。硬件测试主要体现在发生硬件故障时,存储能正常对外提供服务,不影响业务。性能测试主要模拟业务场景下,对存储进行读写压力测试,确认性能测试结果能满足当前业务发展的性能需求。
1.1. 测试环境
1.3. 性能测试
本次性能压力测试华为OceanStor Dorado 18500 V6高端全闪存存储性能,测试工具采用Oracle官网推荐性能测试工具vdbench进行性能测试。
1.3.1. 8KB全写全随机
该场景模型为IO大小8KB,全写,全随机,以最大IOPS下发。脚本配置文件如下:
1.3.2. 8KB全读全随机
该场景模型为IO大小8KB,全读,全随机,以最大IOPS下发。脚本配置文件如下:
测试结果如下:
1.3.3. 8KB读写比7:3全随机
该场景模型为IO大小8KB,读写比7:3,全随机,以最大IOPS下发。
测试结果截图如下:
1.3.4. 8KB读写比3:7全随机
该场景模型为IO大小8KB,读写比3:7,全随机,以最大IOPS下发,属于典型OLTP数据库场景。配置脚本文件如下:
1.3.5. 512KB 95%读 全顺序
该场景模型为IO大小512KB,95%读,全顺序IO,以最大IOPS下发。该场景为典型OLAP数据库场景,配置脚本文件如下:
1.3.6. 512KB 全写 全顺序
该场景模型为IO大小512KB,全顺序写,以最大IOPS下发。配置脚本文件如下:
该场景下,对应时间段,存储控制器压力负载均衡,块带宽流量(IO吞吐量)较大;
总结:采用Swingbench指定业务模型下发业务IO场景下,在控制器插拔、电源模块拔插、后端级联模块插拔、硬盘插拔、风扇模块拔插时,业务IO不中断,表现基本平稳;前端接口模块故障时,业务由其它接口模块接管,IO发生瞬时中断后迅速恢复。在性能测试中,其中读写的IOPS和时延基本符合测试预期,满足此次项目性能要求。
二.异构虚拟化在线数据迁移应用实践
本次项目采用华为OceanStor Dorado18500 V6高端全闪存储主要解决的问题是将之前在EMC存储上的核心数据库迁移到新存储。在迁移过程中会面临以下几种挑战:迁移复杂度高、核心业务要求零停机,零中断、数据迁移过程中影响数据库性能等。为了解决这些问题,本次迁移采用华为存储异构虚拟化数据迁移技术。
其中主要步骤如下:
1:源存储和目标存储建立连接,并把待迁移的LUN同时映射给目标存储。
2:目标存储创建在线接管eDevLUN并映射给主机。
3:主机多路径完成源LUN和eDevLUN的链路聚合,并把主机IO切换到目标存储链路。
4:目标存储创建SmartMigration,把eDevLUN数据迁移到目标存储内部LUN。
5:源存储和目标存储断开连接,源存储退网。
主要优势如下:
存储间数据拷贝,不占用主机资源。
迁移速率可控:单任务速率在5-1000MB/s之间,支持自定义速率上限;支持36任务并发,总迁移速率Up to 3GB/s;支持按照业务高峰低谷自动调整迁移速率大小;支持迁移暂停与断点续传
无需停机时间,数据库无感知,切换瞬间IO悬挂,链路切换完,IO下发。
向导式配置:整个过程由迁移工具自动完成,只需填写并导入相关信息即可。
多任务控制管理,迁移状态实时可见。
2.2. 异构虚拟化迁移实施方案
2.2.1. 迁移概况
1)组网情况
现网EMC存储为1套双节点OracleRAC集群主机提供存储空间,现网逻辑组网图如下:
2)变更描述及影响
本次变更需将原EMC存储上20个512G的存储卷在线迁移到华为OceanStor Dorado18500 V6高端全闪存储上。业务在线状态下,进行异构存储接管、数据迁移、分离源存储。
2.2.2. 迁移准备
1) 本次数据迁移前准备工作如下:
2) 变更前注意确认事项检查
1. 原存储阵列与华为OceanStor Dorado18500 V6高端全闪存储兼容性检查.
2. 检查并记录外部LUN的ALUA策略。确认方法:执行命令multipath -ll(确认已开启ALUA)。
3) 迁移工具安装
1. 将软件包上传到准备好的管理迁移服务器上,软件版本为V2R7C00***(具体版本视现场环境为准)
2. 双击start.exe启动。
3.导入此次迁移所需license,需注意容量大于此次迁移数据库的大小。
-
重新加载双边multipath守护进程
systemctl reload multipathd.service
echo 1 >/sys/class/scsi_device/2:0:2:0/device/delete
3) 配置迁移操作步骤
- 获取源存储信息
- 通过点击页面上的“获取”导入模版,获取资源文件格式模版,按照格式填写信息
- 获取华为存储信息
- 选择添加迁移主机并手动添加指定业务主机
- 选择主机类型、配置主机为非对称模式、配置双活优先路径为否
- 目的存储规划(LUN全选,点击lun配置)
- 批量LUN配置(目的存储池选择ID:0)
- 配置任务(业务接管模式为零中断),设置源存储配置模式为手动模式,配置IO路径切换模式为自动切换模式设置迁移速率(中:10MB/s-20MB/s;高:20MB/s-70MB/s;最快:100MB/s以上),选择一致性分裂手动执行。
- 任务概览,确认信息无误。
- 登录原存储,手动添加华为存储为host,映射待迁移的lun给华为存储。待手工映射操作完毕,点击继续。(注:映射给本端存储系统的主机LUN ID需要与异构存储系统映射给应用服务器的主机LUN ID一致,否则无法完成在线接管。)
- 华为存储自动添加主机eDevLUN映射
14.自动执行主机磁盘I/O路径切换
- SSH登录数据库节点,查看路径状态,解除源存储LUN映射,执行多路径命令#multipath -ll,回显信息为HUAWEI XSG1,说明IO路径切换成功。
- 初始化数据迁移
- 迁移完成确认无误后,手动进行华为18500-1存储LUN迁移一致性分裂。
- 源存储解除到华为存储的LUN映射。
- 迁移完成后业务验证,值守保障1小时,确认无问题后知会现场施工人员离场。
总结:这次迁移完美实现了从异构存储在线至华为高端存储,在迁移过程中,流程自动化,规范化,无需人工干预迁移过程,衷心希望厂商对migration director这个软件能够不断更新迭代出更符合用户需求更便捷的版本。
2.3. 迁移失败回退方案
2.3.1. 迁移失败定义
Ø 人工误操作或使用工具迁移发生不可预知的问题且联系后台研发无法解决。
Ø 光纤链路全部故障。
Ø 业务验证发现数据不完整。
Ø 业务经过重新配置后无法正常运行,而且没有相关解决方案。
状态检查:由存储管理人员各保障组检查源存储、主机、及业务系统等各系统状态。由华为工程师检查华为存储运行状态。
三.总结
本文第一部分主要描述了华为存储上线前的硬件以及性能测试,确保上线前能满足当前的业务要求。第二部分主要讲述华为存储高端特性异构虚拟化的技术迁移原理以及本次具体使用此技术的详细迁移方案。
通过对华为存储的硬件以及性能的POC测试,为此次项目实施提供保障,确保安全和性能满足项目要求。此次项目采用了华为异构虚拟化迁移技术,完美的解决了从其它存储厂商存储设备无间断的迁移数据到华为存储。截止目前新一代数据中心始终安全平稳运行,存储设备未出现任何异常,性能及高可用性完全满足我司业务需求,通过持续不断的监控及维护,各项数据指标也证明了华为高端存储硬件的稳定可靠性。具体的选型经验与实际实现的运行效果,可以阅读第三部分:选型经验和效果篇。希望可以对同业有所帮助和参考。
全系列点击阅读:
某金融行业使用华为高端存储的应用实践经验之选型经验和效果篇:
https://www.talkwithtrend.com/Article/259813
某金融行业使用华为高端存储的应用实践经验之测试和数据迁移篇
https://www.talkwithtrend.com/Article/259811
某金融行业使用华为高端存储的应用实践经验之需求分析及设备选型思路篇
https://www.talkwithtrend.com/Article/259815
如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!
赞3
添加新评论0 条评论