数据处理
数据处理
该主题还没有描述

问题

IT其它数据分析·2018-03-13
nkj827 · 长春长信华天 擅长领域:存储, 灾备, 服务器
770 会员关注
在各个环节控制质量的最开始,我们需要对数据质量管理进行标准定义处理。即对元数据进行梳理,并按照元数据管理理念,对各个环节的数据进行管控。在此只探讨结构化数据,非结构化数据可以结构化之后再以此法继续。0、元数据管理元数据管理简单来说,就是建立一套标准的指标(度量)、...
保险数据质量·2018-03-13
jason2006xu · 昆仑银行 擅长领域:系统运维, 监控, 云计算
45 会员关注
可以采用人工的方式进行核对数据质量。
互联网服务cognos·2017-09-05
jdw_cognos · IBM 擅长领域:商业智能, 大数据, cognos
15 会员关注
report sdudio 或者 analysis sdudio 组件可以实现
保险应用场景·2017-07-21
美国队长 · Alibaba 擅长领域:大数据, 大数据平台, 数据库
512 会员关注
1.文件统计行数2.抽取文件中每行特定的字符3.对结构化文件的特定字段进行排序4.文件之间进行关联5.统计文件包含特定字符的个数等
银行spark·2017-07-03
美国队长 · Alibaba 擅长领域:大数据, 大数据平台, 数据库
512 会员关注
其实我更觉得他们的优化策略很相似,有错的地方还请指出1.数据倾斜,碰到小表跟大表的关联数据倾斜都是希望把小表在每个计算机器上复制一份放在内存当中只是调用的api不同,或者将倾斜的key加随机数前缀,实质也是为了数据分布均衡2.内存方面都希望最大限度的把数据放在内存中处...
金融其它数据丢失·2017-06-14
y18511664518 · 长城超云 擅长领域:数据库, 存储, 关系型数据库
601 会员关注
既然名称就是下线业务,说明这方面的业务已经废弃,但是任何数据对一个企业来说,都有其重要性,建议存储其核心,如果是已经确定的可以废弃的数据,直接干掉,或者归档存储。
金融其它数据挖掘·2017-06-13
wangql · NULL 擅长领域:存储, 备份, 软件定义存储
1224 会员关注
处理和挖掘同时包含了对在线和近线、归档数据的处理要求。对应在线数据来说,直接被当前的应用生产或使用,无需过多考虑,唯一指的注意的是需要区分在线、近线、归档的度,将不同生命周期节点的数据合理的分离出来,这样对在线数据的访问效率有很大的提升。对应历史数据、归档数据...
互联网服务大数据平台·2017-04-19
hadoop处理数据的优化,不同的业务有不同的方法,针对运营商的网络数据,有什么比较好的方法呢?或者跟电商相比有什么不同的地方呢?
浏览4287
互联网服务数据处理·2016-10-27
Bangben · ibm 擅长领域:大数据, 商业智能, cognos
86 会员关注
对于PB级数据,可以基于IBM大数据平台big insight来做,SQL层有big insight家族中的 big sql,对于SQL的支持比较好. Cognos有big sql的直接访问接口.
互联网服务数据集中平台·2015-12-30
s6dong · 东软集团 擅长领域:存储, 服务器, 灾备
960 会员关注
能否对医疗数据进行有效采集与交换,是影响数据集中平台最终应用效果的关键。数据质量差、标准规范不统一等现象为困扰平台建设的共性问题。针对医疗卫生行业自身业务特点,一般的解决方案以SOA架构为基础,构建数据存储中心,实现医院各应用信息系统集成及数据交换。通过企业服...

描述

该主题还没有描述
X社区推广
  • 提问题