各位对数据治理的看法?

数据质量可以说是数据仓库的生命,再好的数据模型、方法论、实施人员也无法抵御数据质量风险,各位在数据治理上有什么看法,比如:是在源头各业务系统治理还是在后期单独立项治理。 ...显示全部
数据质量可以说是数据仓库的生命,再好的数据模型、方法论、实施人员也无法抵御数据质量风险,各位在数据治理上有什么看法,比如:是在源头各业务系统治理还是在后期单独立项治理。 收起
参与69

查看其它 21 个回答yuvv的回答

yuvvyuvv其它联动优势
说起数据治理其实是一个很偏见的词,如果把数据抽象为对象来看是与人平等的,人也可以看做成“对象”,人的治理?很不舒服吧,做数据首先要尊重数据。数据本身要从三个层面来看待,第一是业务层面,第二是技术层面,第三是系统层面。第一从层业务层面来讲,例如A业务中生成的数据都是客观存在的A业务数据,对于B业务来说好不意义,那么B有资格把A业务数据删除掉么?对B来说是数据治理,但对于A业务来说是极其不公平事,所以无论在A业务还是B业务来说数据是业务过程中自然产生的,大家都应该尊重他,数据没有犯错,就像一个无辜的孩子,决定不了自己能不能来在这个世界上。
第二层面是技术层面,技术可能会在业务的范围能对数据做一些相对价值数据的考量来做数据筛选和清洗,就是所谓的ETL,无论是以往的DW还是现在的分布式,ETL都是技术的重中之重,治理数据我一直认为是技术人员的治理,一个负责的人喜欢数据技术那么他会对每一条数据都尽量做到精准,结构化过程中字段的选择会尤其上心,让数据可以充分发挥自身的价值,让数据展现在人们的眼前,不会让数据沉默在漆黑的数据库里,即使暂时没有起到作用的数据也会保存到安全的数据库中,等挖掘技术的成熟会依靠数据自身来发现新的业务场景,国外的FICO公司用信用卡消费推测保险行业的用户出险率,并且极高的准确率,这是跨行业的数据使用,在国内可能会让人想象不到,可人家做到了对数据的尊重,所以技术层面治理数据我认为是人价值观的自我治理。第三个是系统层面,往往有些廉价系统或操作不规范导致数据的缺失或字符串不全,这是很可悲的一件事,没有谁刚出生就希望自己是残疾,那么遇到这样的情况,公司的运营人员应该想一想了,如何把数据补全,技术人员任何可以完善系统,至于数据模型、方法论这些都是技术层面的小事,有空看几本书自然就会了。
互联网服务 · 2015-08-27
浏览2152

回答者

yuvv
其它联动优势
擅长领域: 大数据商业智能

yuvv 最近回答过的问题

回答状态

  • 发布时间:2015-08-27
  • 关注会员:1 人
  • 回答浏览:2152
  • X社区推广