当数据量达到TB级以上,如何避免平台架构出现性能瓶颈?

当数据量达到TB级以上,如何避免平台架构出现性能瓶颈?

参与9

3同行回答

loveryueloveryue软件开发工程师IBM
TB级别的数据量,在系统层面需要考虑到三个方面1. CPU和内存:特别要考虑cpu能力强,内存带宽大的系统2. IO能力:无论是MR或者Spark,都会都大量的数据写入磁盘,所以IO往往会成为瓶颈,所以尽量多配置硬盘,有条件的可以配置SSD3. 网络架构:1TB的数据量往往有多个进程或者多个节点,节点间...显示全部

TB级别的数据量,在系统层面需要考虑到三个方面

1. CPU和内存:特别要考虑cpu能力强,内存带宽大的系统

2. IO能力:无论是MR或者Spark,都会都大量的数据写入磁盘,所以IO往往会成为瓶颈,所以尽量多配置硬盘,有条件的可以配置SSD

3. 网络架构:1TB的数据量往往有多个进程或者多个节点,节点间的数据交换和通讯非常占用资源,建议使用万兆交换机或者infiniband系统

收起
互联网服务 · 2016-06-02
浏览2731
tech4betterlifetech4betterlife信息分析/架构师IBM
我们的日志系统是完全基于大数据开发的,数据量增大后,可以增加节点来扩展系统容量。另外,也对数据建立了索引,所以速度很快。我们曾做过一个项目,保存90T数据,每天增加1T,使用了4台PowerLinux,资源还有大量冗余,速度很快。...显示全部

我们的日志系统是完全基于大数据开发的,数据量增大后,可以增加节点来扩展系统容量。另外,也对数据建立了索引,所以速度很快。

我们曾做过一个项目,保存90T数据,每天增加1T,使用了4台PowerLinux,资源还有大量冗余,速度很快。

收起
软件开发 · 2016-06-02
浏览2589
chenrynchenryn产品总监日志易
最重要的是选一个本身就方便横向扩展的分布式架构。靠纵向扩展,CPU、IOPS等等总是有上限的。但是横向扩展就比较方便了。显示全部

最重要的是选一个本身就方便横向扩展的分布式架构。靠纵向扩展,CPU、IOPS等等总是有上限的。但是横向扩展就比较方便了。

收起
软件开发 · 2016-06-02
浏览2489

提问者

colins
colins0411
系统工程师金融行业
擅长领域: 服务器存储灾备

问题来自

问题状态

  • 发布时间:2016-06-02
  • 关注会员:4 人
  • 问题浏览:6715
  • 最近回答:2016-06-02
  • X社区推广