能举例讲讲多元线性回归、决策树、贝叶斯在数据库AIOps 运维平台上是如何应用的吗?

在数据库问题故障检测中,使用到了三种故障检测算法:孤立森林、DBSCAN、3σ准则。
能举例讲讲多元线性回归、决策树、贝叶斯在数据库AIOps 运维平台上是如何应用的吗?

1回答

孔再华孔再华  数据库运维工程师 , 中国民生银行
zhuhaiqiang冯岩赞同了此回答
多元线性回归、决策树、贝叶斯都是非常好用的机器学习算法。首先这几个算法都是监督学习算法,也就是数据需要预先打标签的。我当前还没有使用到这几种算法的原因也是因为没有人力财力去打标签,需要运维数据更丰满之后才能进一步使用。但是这些算法最终还是会应用到智能场景...显示全部

多元线性回归、决策树、贝叶斯都是非常好用的机器学习算法。首先这几个算法都是监督学习算法,也就是数据需要预先打标签的。我当前还没有使用到这几种算法的原因也是因为没有人力财力去打标签,需要运维数据更丰满之后才能进一步使用。但是这些算法最终还是会应用到智能场景里来。 AI 算法的最终能力分两类:回归和分类。

  1. 回归:回归类算法适合做预测,也可以用来做量化。例如多元线性回归算法,计算每个变量 x 对预测对象的 Y 的贡献能力 w 。比较有意思是我刚开始做智能运维其实出发点是想要用这个算法计算数据库的各种指标计数对 DB2 使用的 CPU 消耗关系的。一旦 CPU 高,我能知道是什么指标导致的,也就知道是什么行为导致的。这个模型测试了,确实有很好的效果,但是我没有集成到当前的智能运维里面。因为监控 cpu 高再找根因的使用频率太少了,其他场景也类似。这个我会在未来考虑补充,当前人力有限,需要考虑投入产出比。

  2. 分类:这种适合检测和做决策。决策树,逻辑回归,随机森林等众多分类算法都有很强大的能力。相对于神经网络,这些算法还具有可解释性。我当前在做磁盘的故障检测,考虑会使用这些算法。这些算法需要打标签的数据,例如标记数据库是否异常。这些算法能告诉你数据库是否异常,异常的原因可能是什么。这种数据库整体异常的情况太少了,当前还没有足够的数据来训练,暂时用不到。

  3. AI 在自然语言处理领域也有很高的发展。其中文本分析,词向量,文本向量等一系列技术在智能运维领域也能得到应用。当前我计划做个日志故障分析,会使用到这方面的一些 AI 技术。

收起
 2019-12-19
浏览297
冯岩 邀答

提问者

冯岩数据库管理员, 银行

日志分析平台选型优先顺序调研

发表您的选型观点,参与即得50金币。

问题状态

  • 发布时间:2019-12-18
  • 关注会员:2 人
  • 问题浏览:1757
  • 最近回答:2019-12-19