Hadoop
Hadoop
Apache Hadoop是一款支持数据密集型分布式应用并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。
Apache Hadoop是一款支持数据密集型分布式应用并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。

热点

Hadoop集群配置·2020-12-09
匿名用户
收藏3
金币1
Hadoop·2020-12-09
匿名用户
收藏2
金币1
大数据·2020-09-25
努力呀XX 擅长领域:数据库, 服务器, 云计算
48 会员关注
收藏1
金币1
Hadoop·2020-08-25
努力呀XX 擅长领域:数据库, 服务器, 云计算
48 会员关注
作者:农行研发中心孟洋--1.问题描述当前,我们通过编写HadoopMapReduce程序对来自上游的源数据文件进行贴源预处理加工。源数据文件发到Hadoop集群后,我们的预处理程序会对源数据进行编码转换、数据去重、加时间拉链、数据清洗、错误数据处理等操作,生成贴源的ODS层数据,供上层...(more)
浏览8083
银行Hadoop·2020-07-31
左右ex-IBM 擅长领域:大数据, 商业智能, 联机分析处理
27 会员关注
简单说说我的想法,---- 直接回答题干 ----如果说现有Hive作为数仓,那么性能肯定不能满足查询的,替代方案可以选择MPP数据库,但是由于MPP数据库目前看来还是有软硬件+人员能力限制条件的,基本上也要搞成一个团体作战项目才能摸索出来。你提到的多表关联倒不是什么障碍,建设数...
Hadoop·2020-05-18
yeliye某农信 擅长领域:数据库, 大数据, 服务器
5 会员关注
收藏2
金币1
保险Hadoop·2020-03-04
youki2008DDT 擅长领域:服务器, 云计算, 数据库
253 会员关注
hadoop 在处理大规模数据时是很高效的,处理小文件时,可以将小文件打包为大文件,例如使用 SequcenFile 文件格式,这样多个小文件就可以通过 SequcenFile 文件格式变为一个大文件,之前的每个小文件都会映射为 SequcenFile 文件的一条记录。...
大数据平台·2020-02-05
kappyy某银行 擅长领域:大数据, 大数据平台, 服务器
2 会员关注
1     背景银行业是一个数据密集型行业,也是一个数据驱动的行业,数据一直是银行信息化发展的主题词。而今,在互联网金融时代,伴随着商业银行经营转型的持续深入,各家银行对大数据应用的需求日益多元化,迫切希望借助大数据应用,践行以金融科技赋能业务创新及服务体验升级。...(more)
浏览10114
评论1

描述

Apache Hadoop是一款支持数据密集型分布式应用并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。
Apache Hadoop是一款支持数据密集型分布式应用并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。
X社区推广
  • 提问题