工业制造其它etl系统运维etl瓶颈

制约etl的瓶颈是什么?CPU 内存 IO还是网络?

制约etl的瓶颈是什么?CPU 内存 IO还是网络?如何从IT架构方面去避免可能存在的瓶颈?显示全部

制约etl的瓶颈是什么?CPU 内存 IO还是网络?如何从IT架构方面去避免可能存在的瓶颈?

收起
参与14

查看其它 2 个回答xuyanhui的回答

xuyanhuixuyanhui信息分析/架构师58同城大数据

前面两位都总结的很好,其实涉及到大数据环境下的分部署并行运算,那最重要的问题在于后端的数据汇总部分,也就是我们常说的MR中的shuffle部分,大量的中间结果通过网络IO进行数据的迁移,带来的网络资源占用严重,无轮从计算本身也好还是逻辑也好,都需要进行优化与分析。

互联网服务 · 2015-10-15
浏览1763

回答者

xuyanhui
信息分析/架构师58同城大数据
擅长领域: 服务器大数据大数据平台

xuyanhui 最近回答过的问题

回答状态

  • 发布时间:2015-10-15
  • 关注会员:5 人
  • 回答浏览:1763
  • X社区推广