Q先生
作者Q先生·2020-05-05 15:31
研发总监·某公司

人工智能浪潮之下,灾备可以做些什么?

字数 2103阅读 2703评论 0赞 3

要说现在最火的技术是什么,人工智能(AI)肯定算一个,甚至人工智能已经成为了新基建。当前我们所知道的AI应用包括:无人驾驶、人脸识别、语义分析、智能监控等。由于AI技术的快速发展,它的应用场景也在更多的被发掘。本篇文章我们就来聊聊AI的技术浪潮下,灾备产品可以做些什么。

利用AI分析业务依赖和重要性等级

目前各项技术和业务软件层出不穷,并持续向着更复杂的方向发展。这对IT管理的同学们来讲,无疑加大了灾备建设的难度,业务和业务之间的依赖关系是什么?哪个业务更重要?都有怎样的RTO/RPO要求?这些光在灾备建设调研阶段可能就会消耗大量的时间。

结合业内的IT监控、分析软件(一些灾备厂商本身也会提供一些IT监控分析的解决方案,像Veeam的Veeam One Monitor,像Veritas收购的APTARE等等),利用AI技术识别出业务之间的关联关系,被关联最多的业务对象理论上也是最核心的业务,需要具备更高的RTO/RPO。有了业务依赖关系,IT管理员可基于此更轻松的制定灾备计划和方案。

利用AI提供主动数据保护能力

生产环境不是一成不变的,业务的变更会引起IT环境的调整,原本建设好的灾备计划自然也需要跟着调整。当灾备解决方案具备对生产环境进行检测分析能力之后,自然可以发现业务过程中的依赖变更,利用AI的能力,可以尝试对这些变更进行自动处理,比如:

  • 根据业务依赖关系控制数据备份优先级。
  • 自动将新增的业务对象纳入数据保护计划中。
  • 根据依赖关系的变更自动调整备份/容灾策略。
  • ......

如此,灾备产品更加“智能”。

给IT管理员提供更可靠的灾难恢复建议

灾备技术的目的是进行数据保护,确保用户在生产系统出现故障后,有数据可接管和恢复。但遗憾的是,即使有灾备技术的支撑,也很难100%保证数据可以进行有效的恢复。

典型场景1:当生产环境出现故障后,在IT管理员定位问题之前就提供恢复建议。 让AI具备对生产系统的理解能力,当生产系统故障后,自动分析出故障点,并从灾备数据中找到可恢复的数据提供给IT管理员。

典型场景2:复杂业务场景下,给IT管理员提供各个业务数据对象的恢复时间点参考。 业务越复杂,业务内涉及的数据对象之间耦合也就越强。当业务出现故障后需要进行恢复,由于恢复到的是不同的历史时刻,导致业务之间的交互出现故障,仍然需要IT管理员进行手工修复和调整;或者进行二次恢复寻找有效时间点。以此加大了灾难恢复的难度。利用灾备产品提供的周期演练能力,跟演练结果进行数据训练,让AI帮助找到最合适的各个业务对象的恢复时间点,以此给IT管理员提供灾难恢复建议。如下图所示:

可能有些同学会考虑利用AI技术提供主动灾难恢复能力,以此保障业务连续性。此处Q先生还是持谨慎态度,更建议提供灾难恢复的参考建议,而不代替IT管理员做灾难恢复。

预测和预警

当数据量变得越来越大,灾备技术和灾备任务的管理变得越来越复杂,对很多IT管理员来讲,就更需要一些预测预警机制。利用AI技术,可以尝试对整体灾备情况进行预测,在出现预期外的情况下提供告警功能。可以预测预警的方向可以包含:

  • 根据业务数据的变更情况预测灾备数据的存储介质什么时候用尽,方便IT管理员提前进行资产预算。
  • 根据数据的灾备和演练情况预测具体业务的RTO,超出用户预期范围则进行告警。
  • 让AI学习典型业务异常情况下的数据变化模型,并应用于灾备过程,对满足异常数据变化模型的增量过程进行预警(举个例子,假设业务数据经历A->B->C->D的变化过程后,到达D状态就必然会出现业务故障,此种情况通过灾备过程中的数据变化检测即可做到在D发生前进行预警)。
  • ......

灾备数据的利用分析

灾备可以说站在了数据的制高点,不仅可以访问生产环境数据,同时对生产环境的数据进行历史版本管理。可以说,用于灾备的存储就是一个数据湖。我们除了可以考虑让灾备能力本身更智能外,还可以考虑将灾备过来的数据提供出来,作为AI数据分析和训练的数据集。并且有的灾备厂商已经在这么做了(后面Q先生会专门写一篇文章来陈述现有灾备厂商的AI探索,大家可以持续关注“灾备有道”公众号)。

利用AI优化特定灾备技术

上述的讨论更多还是停留AI可以给我们的业务带来的可能性,AI同样有可能给特定的灾备技术带来更优的解决方案。一种可能是利用AI提供更智能的重删能力。我们知道在数据量很大的情况下,往往大家会选择使用数据去重技术。利用AI技术,可以尝试针对不同的业务数据提供更优的数据去重模型,以此提升数据去重效果。另外一种可能是对冷热数据的智能转换。灾备存储在提供恢复或开发测试能力时,需要更优的数据访问性能,结合AI技术,根据数据访问的行为提前预测下一次访问的数据片,并提前将冷数据转换成热数据。

以上便是Q先生对AI技术在灾备产品中应用场景的浅见,也欢迎大家加Q先生微信(QSirDR)一起讨论。技术的发展一定会给我们带来更加优秀的产品,相信我们在不久之后就能看到AI技术与灾备技术的碰撞和融合,以及其带来的价值。

作者简介 :
---- Q先生 , “ 灾备有道 ” 公众号作者,一个灾备行业混迹多年的技术人。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

3

添加新评论0 条评论

Ctrl+Enter 发表

作者其他文章

相关文章

相关问题

相关资料

X社区推广