厂商吐血经验分享-如何构建落地的双活数据中心

厂商吐血经验分享-如何构建落地的双活数据中心

1. 双活数据中心是什么样子

• 两个站点, 相隔无限的距离, 运行相同的应用且拥有相同的数据,提供跨站点负载分配和连续可用(CA)/灾难恢复(DR)
• 模式的变迁: 从故障恢复模式转变为近持续可用模式
• Workload级别的应用颗粒度划分

2. 双活数据中心核心概念之Workload

整个方案配置的基础是workload
– 哪些workload是Active Standby模式的;哪些workload是Active Query模式的
• 一个workload的三个要素
– 软件: 用户程序以及支撑他们的运行环境
– 数据: 相关的必须保证交易完整性和一致性的数据,甚至是有读完整性限制的数据 (如,DB2表)
– 网络连接: TCP/IP的地址和端口 (如, 10.10.10.1:80)
1.png

1.png

3. 双活数据中心需要考虑的问题

同城双活为最关键的业务应用提供连续可用性。同时,可利用B站点的实时生产数据:
– 减少或避免关键应用的计划内停机时间和次数
– 减少或避免关键应用的意外停机,确保为关键应用提供连续可用性
– 同城双活站点都运行工作负载
•动态路由联机交易,充分利用站点A和B的基础架构资源。
•合理分配工作负载,提高批处理的及时性;
•实现更及时的报表生成;
•联机完成复杂历史信息查询等。
•将两个站点和系统松散连接在一起(或保持独立性),防止性能问题“蔓延”。
– “近实时业务分析”,利用第2个站点中的近实时生产数据来开展业务创新。
– 合理安排工作载荷,构建可靠的“事务处理中枢”与智慧的“业务分析中枢”

4. 双活中心解决方案主要技术组件

  1. 站点间的工作负载路由
  2. 数据复制技术:
  3. 数据库级复制
  4. 存储器级复制
  5. 或者上述二者组合
  6. 技术基础架构的标准化/模块化
  7. 三中心运营的协调与自动化
  8. 应用适应性

5. 实施双活数据中心的大纲

• 设定双活的目标
• 规划第二站点
• 了解现有基础架构
• 了解workload, 联机和批量
• 规划梳理网络接入
• 规划数据复制
• 如何与现有的DR方案协作
• 切换场景设计及演练
• 操作步骤和风险控制的更新

2.png

2.png

6. 双活数据中心网络重点关注点

• 网络连接建立的方向;应用数据的流向;交易报文的输入输出流。
• 路由策略的考虑
– TCP/IP的连接形式:长连接,短连接或 “中”连接?
– 有没有使用动态路由技术?
– 网络收敛如何完成,有什么影响?
• 计划内、计划外Workload路由切换时的需求
• 网络路由的切换和任何应用组件之间的协调关系?
• 在途交易如何处理?
• 和数据复制之间的协同?
• 切换的时间控制盒自动化?
• 对交易的性能和可用性是否有影响?

7. 双活数据中心数据复制关注点

• 基于软件的数据复制支持DB2,Oracle informix等。
• 在您的单位业务处理如何使用数据:
• 联机交易是否访问多个recoverable resource且有一致性需求?
• 联机和批量之间的数据相关性?
• 是否也需要复制批量处理的数据和中间结果?批量的断点续跑如何实现?
• 批处理的数据和联机数据的site B如何同步?
• 系统的数据如何考虑?如系统配置文件的变更等
• 异步数据在非计划切换时存在的数据丢失情况如何弥补?
• 是否存在多个data sharing group?他们之间有没有一致性需求?
• 性能考虑,网络带宽的需求等?
• 其他性能的需求可能导致应用数据表结构的调整?
• 联机/批量数据
• 数据一致性考虑?
• RPO=0的考虑?
• 和磁盘复制技术及应用的协作?

8. 双活数据中心实施经验总结

以workload为核心设计的双活解决方案;
• 通过软件实现的数据异步复制技术同步数据;
• 应用交易的网络接入和workload划分在实施中非常重要;
• 计划内计划外的切换场景,数据恢复(RPO)的保证等需要仔细设计;
• 对生产运维带来的改变需要仔细梳理和规划;
• 统一的自动化管理很重要

参与4

1同行回答

匿名用户匿名用户
学习下显示全部

学习下

收起
系统集成 · 2017-09-21
浏览1697

提问者

myciciy
myciciy21035
IT顾问某金融科技公司
擅长领域: 服务器存储灾备

问题来自

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2017-05-12
  • 关注会员:3 人
  • 问题浏览:4525
  • 最近回答:2017-09-21
  • X社区推广