当数据量达到TB级以上,如何避免平台架构出现性能瓶颈?

当数据量达到TB级以上,如何避免平台架构出现性能瓶颈?

参与9

3同行回答

loveryueloveryue软件开发工程师IBM
TB级别的数据量,在系统层面需要考虑到三个方面1. CPU和内存:特别要考虑cpu能力强,内存带宽大的系统2. IO能力:无论是MR或者Spark,都会都大量的数据写入磁盘,所以IO往往会成为瓶颈,所以尽量多配置硬盘,有条件的可以配置SSD3. 网络架构:1TB的数据量往往有多个进程或者多个节点,节点间...显示全部

TB级别的数据量,在系统层面需要考虑到三个方面

1. CPU和内存:特别要考虑cpu能力强,内存带宽大的系统

2. IO能力:无论是MR或者Spark,都会都大量的数据写入磁盘,所以IO往往会成为瓶颈,所以尽量多配置硬盘,有条件的可以配置SSD

3. 网络架构:1TB的数据量往往有多个进程或者多个节点,节点间的数据交换和通讯非常占用资源,建议使用万兆交换机或者infiniband系统

收起
互联网服务 · 2016-06-02
浏览2752

提问者

colins
colins0412
系统工程师金融行业
擅长领域: 服务器存储灾备

问题来自

问题状态

  • 发布时间:2016-06-02
  • 关注会员:4 人
  • 问题浏览:6747
  • 最近回答:2016-06-02
  • X社区推广