软件开发数据质量

预测阶段如何保证画像的数据质量

      在视频里您分享的PPT,看到日志分析管理的阶梯模型里有预测这个阶段,这个阶段会“对数据中心进行360 度画像”,然后根据这些画像进行数据挖掘,进行各种预测。

      这里,想请教几个问题?

      1、请简单介绍一下 “画像”是如何构建的

      2、构建画像特征的过程是否会用到数据挖掘的算法,如LR、DT、SVM等?

      3、如果会用到数据挖掘算法,那么如何保证画像特征数据的数据质量?(数据的质量会很大程度上影响预测模型)


     谢谢!~

     

参与3

1同行回答

tech4betterlifetech4betterlife信息分析/架构师IBM
360 度画像一般是对一个对象全方位的信息展示,某些内容可以使用您提到的决策树,逻辑回归或者SVM来挖掘获取。关于挖掘的精确性,设计多个方面,你提到的方面很重要,首先要对数据清洗整理,特征工程等,然后再进行挖掘。否则挖出啥结论,大家信不信,还真不好说。:-)...显示全部

360 度画像一般是对一个对象全方位的信息展示,某些内容可以使用您提到的决策树,逻辑回归或者SVM来挖掘获取。

关于挖掘的精确性,设计多个方面,你提到的方面很重要,首先要对数据清洗整理,特征工程等,然后再进行挖掘。否则挖出啥结论,大家信不信,还真不好说。:-)

收起
软件开发 · 2016-06-02
浏览1429

提问者

qinkai
研发工程师爱奇艺
擅长领域: 大数据

问题来自

相关问题

问题状态

  • 发布时间:2016-06-02
  • 关注会员:2 人
  • 问题浏览:3888
  • 最近回答:2016-06-02
  • X社区推广