软件开发

hadoop优化

hadoop如何进行优化效率。
参与4

4 同行回答

佘星星 佘星星 技术支持 华南
回复 4# 冬天里的鱼 建议单独开一个贴,这样两位老师好有针对性进行解答!显示全部
回复 4# 冬天里的鱼

建议单独开一个贴,这样两位老师好有针对性进行解答! 收起
系统集成 · 2013-12-19
浏览1098
冬天里的鱼 冬天里的鱼 测试工程师 aaa
hi,如果我有一台3个G的虚拟机 部署单节点的hbase hadoop 启动时会报内存溢出 我该如何解决。谢谢显示全部
hi,如果我有一台3个G的虚拟机 部署单节点的hbase hadoop 启动时会报内存溢出 我该如何解决。谢谢 收起
IT其它 · 2013-12-19
浏览1069
wjl120 wjl120 系统工程师 IBM
"hadoop如何进行优化效率" 这个问题比较大, 不同的场景,组件,业务逻辑,数据类型, 硬件配置等等都都会有不同的情况和策略; 从思路上讲:  1. 首先确定优化对象的第一瓶颈在哪里 ?    大类可分为:  iops, CPU使用率, 内存使用率, 网络传输速...显示全部
"hadoop如何进行优化效率" 这个问题比较大, 不同的场景,组件,业务逻辑,数据类型, 硬件配置等等都都会有不同的情况和策略; 从思路上讲:  
1. 首先确定优化对象的第一瓶颈在哪里 ?    大类可分为:  iops, CPU使用率, 内存使用率, 网络传输速率;
2. 确定该瓶颈是否可以解决, 如果可以, 那就扩展硬件解决瓶颈, 如果硬件无法或不能再扩展:
3. 那就从Hadoop层考虑,进行参数调整以减弱相关的硬件压力, 比如较低HDFS的复制数, 可以降低网络流量,提高响应速度;
4. 如果以上三点都没有太大的优化空间, 那么可以从问题需求这个高端来重新审视你的分析平台的设计;
5. 最后,如果可能的话, 也可以考虑将Hadoop不擅长的处理提取到Hadoop之外进行预处理, 然后再交给Hadoop处理;

总之, 无论什么优化, 都不能一言以概之, 都要具体问题具体分析; 法无定法. 收起
互联网服务 · 2013-12-19
浏览1057
yanhuit yanhuit 系统工程师 IBM
主要参照Hadoop官方给出的配置指南进行的,您可以去下载一本看看显示全部
主要参照Hadoop官方给出的配置指南进行的,您可以去下载一本看看 收起
互联网服务 · 2013-12-19
浏览1012

提问者

richose
项目经理 福利通
评论5

问题状态

  • 发布时间:2013-12-19
  • 关注会员:0 人
  • 问题浏览:2994
  • 最近回答:2013-12-19
  • X社区推广