大型国有银行在应用外部数据的过程中,如何做好数据的分级管理及与行内数据的有效整合,遇到了哪些问题和困难,如何解决的,还请有实施经验的同志不吝赐教
银行的业务不太熟悉,但我相信这个问题和业态关系不太,是每个企业应用数据中的共性问题。在这里观点成立基础上,我阐述我的观点。
(1) 在企业内部,可以也必须引入外部数据,在弥补自身获取数据的不足;
(2)外部的数据源,基本基于购买,应根据自身分析数据的需求进行购买
(3)对外部数据源,要按可信度进行分级,外部数据源供应商,会对自身提供的数据有个基本的评估,而你的公司内部也必须有个评估,最终分析结果的置信区间受到这个评估的影响。
(4)公司内部的数据,在数据采集手段被验证可行的情况下,可信度是最高的,所以分析出的结果可信度也是最高的;
(5)最终提交给管理层的数据分析结构,应该是各自模型分析结果的一个加权平均,加权的多少收到数据源的可信度的影响较大,当然也和分析方法有关系。