匿名用户
这个问题很抽象。不好回答,我的建议是,你不要这么干,因为效率太低了。如果,你这么干的话,就把etl的活也让分析人员给包了,目前,这样的工具很少。通常的做法是把数据从多个数据源抽取过来,不论数据在哪里都要抽取,包括爬虫(当然合理合法范围),然后集中在hdfs上,让分析人员进行分析。分...
数据治理的实施方法:数据质量、数据清洗、数据比对、数据转换的过程
交易型的国产分布式事务数据库产品整理如下:厂商名称产品名称存储引擎计算引擎可视化管理平台生态体系阿里云DRDSMySQL Sever +InnoDB存储引擎完全自主研发完全自主研发等同MySQL开源数据库生态蚂蚁OceanBase自研,类似MySQL的NDB存储引擎完全自主研发完全自主研发自建生态...
1 背景银行业是一个数据密集型行业,也是一个数据驱动的行业,数据一直是银行信息化发展的主题词。而今,在互联网金融时代,伴随着商业银行经营转型的持续深入,各家银行对大数据应用的需求日益多元化,迫切希望借助大数据应用,践行以金融科技赋能业务创新及服务体验升级。...
(more)这个看公司选择,一般情况都是部署在独立物理机,节点越多,算力越强。部署在虚拟机群一般两种情况,一种是试验用,类似做个poc测试用,另一种有超大规模虚拟机群,像阿里,人家的机群性能比物理机性能强太多了。个人经验,普通hadoop机群从十几台到几百台这个规模的,没听说哪家用虚拟机集...
1立治理为本源,引价值为核心1.1前言为引导银行业金融机构加强数据治理,充分发挥数据价值,全面向高质量发展转变,银监会起草了《银行业金融机构数据治理指引(征求意见稿)》(以下简称《指引》)。《指引》遵循监管引领和问题导向,包括七章五十五条,于2018年3月16日起向社会公开征求意...
(more)一、银行大数据平台建设背景及目标我们进行大数据平台建设有几个方面的背景。一是我们在信息化建设和数据分析的基础比较好;二是虽然在信息化建设过程中建设了比较完成的BI应用,但随着业务不断发展,这些解决方案已不能完全满足业务对于数据分析的需求;三是大数据技术的快速发...
(more)首先我表达个人观点,运维数据统一治理并非自动化的先行条件,需要先把运维数据概念的定义以及自动化运维的覆盖范围厘清。我更倾向于配置管理是自动化运维的先决条件。先说说对运维数据的理解,我所认为有几类,一类是描述生产资源的数据即我们常说的配置数据,另一类是生产资源运...