数据质量一直是个难题,因为您的数据已经存在,而且来自于多方,所以质量已经定型了,不好再改变了。建议建立一个元数据标准,然后按照这个标准从这些多方库中导数据到大数据平台时按照标准导入,如果有质量问题可以筛选出来,进行修复、删除或其他用途,通过这种方式,至少保证进入到大数...
显示全部数据质量一直是个难题,因为您的数据已经存在,而且来自于多方,所以质量已经定型了,不好再改变了。建议建立一个元数据标准,然后按照这个标准从这些多方库中导数据到大数据平台时按照标准导入,如果有质量问题可以筛选出来,进行修复、删除或其他用途,通过这种方式,至少保证进入到大数据平台的数据质量是有一定保证的。没有成熟的软件,只能借鉴并定制形成自己的标准元数据和数据质量监控工具。制定标准需要专业人士,至于是否设置人员岗位,这个还是以公司实际情况进行,一身兼多职往往是比较普遍的现象。
收起