Hadoop
Hadoop
Apache Hadoop是一款支持数据密集型分布式应用并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。
Apache Hadoop是一款支持数据密集型分布式应用并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。
热点
来自主题:大数据 · 2020-08-25
努力呀XX 擅长领域:PostgreSQL, 解决方案, 数据库
37 会员关注
作者:农行研发中心孟洋1.问题描述当前,我们通过编写HadoopMapReduce程序对来自上游的源数据文件进行贴源预处理加工。源数据文件发到Hadoop集群后,我们的预处理程序会对源数据进行编码转换、数据去重、加时间拉链、数据清洗、错误数据处理等操作,生成贴源的ODS层数据,供上层建...(more)
浏览594
来自主题:Hadoop · 2020-07-31
左右ex-IBM 擅长领域:cognos, 报表, 云平台
24 会员关注
简单说说我的想法, ---- 直接回答题干 ----如果说现有Hive作为数仓,那么性能肯定不能满足查询的,替代方案可以选择MPP数据库,但是由于MPP数据库目前看来还是有软硬件+人员能力限制条件的,基本上也要搞成一个团体作战项目才能摸索出来。 你提到的多表关联倒不是什么障碍,建设...
浏览3012
回答7
来自主题:Hadoop · 2020-05-18
yeliye某农信 擅长领域:数据库, 高可用, 数据中心
3 会员关注
收藏2
金币1
来自主题:Hadoop · 2020-05-13
匿名用户
收藏1
金币1
来自主题:架构设计 · 2020-02-05
kappyy某银行 擅长领域:大数据, Hadoop, 大数据平台
2 会员关注
1     背景银行业是一个数据密集型行业,也是一个数据驱动的行业,数据一直是银行信息化发展的主题词。而今,在互联网金融时代,伴随着商业银行经营转型的持续深入,各家银行对大数据应用的需求日益多元化,迫切希望借助大数据应用,践行以金融科技赋能业务创新及服务体验升级。...(more)
浏览2116
评论1
来自主题:Hadoop · 2020-01-13
Tamic某保险 擅长领域:MySQL, 数据库
5 会员关注
收藏1
金币1
来自主题:海量数据处理 · 2020-01-13
Tamic某保险 擅长领域:MySQL, 数据库
5 会员关注
收藏1
金币1
来自主题:虚拟化 · 2019-12-18
liuyangccu平安银行 
1 会员关注
这个看公司选择,一般情况都是部署在独立物理机,节点越多,算力越强。部署在虚拟机群一般两种情况,一种是试验用,类似做个poc测试用,另一种有超大规模虚拟机群,像阿里,人家的机群性能比物理机性能强太多了。个人经验,普通hadoop机群从十几台到几百台这个规模的,没听说哪家用虚拟机集...
浏览2215
回答1
来自主题:Hadoop · 2019-10-30
yinxin某金融机构 擅长领域:虚拟化, 云计算, 数据库系统
830 会员关注
收藏1
金币1
来自主题:Hadoop · 2019-10-22
小贝中国联通 
17 会员关注
收藏1
评价1
金币2
描述
Apache Hadoop是一款支持数据密集型分布式应用并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。
Apache Hadoop是一款支持数据密集型分布式应用并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。
  • 提问题