HDFS的优缺点是什么?

参与3

1同行回答

呱呱爱吃瓜呱呱爱吃瓜  数据仓库工程师 , 银行
优点分布式的特性:-- 适合大数据处理: GB 、 TB 、甚至 PB 级及以上的数据-- 百万规模以上的文件数量 :10K+ 节点。-- 适合批处理:移动计算而非数据 (MR), 数据位置暴露给计算框架自身特性:-- HA 高可用:可构建在廉价机器上:-- 高可靠性 : 通过多副本提提高-- 高容错性:数据自动...显示全部

优点

分布式的特性:

-- 适合大数据处理: GB 、 TB 、甚至 PB 级及以上的数据

-- 百万规模以上的文件数量 :10K+ 节点。

-- 适合批处理:移动计算而非数据 (MR), 数据位置暴露给计算框架自身特性:

-- HA 高可用:可构建在廉价机器上:

-- 高可靠性 : 通过多副本提提高

-- 高容错性:数据自动保存多个副本;副本丢失后,自动恢复 , 提供了恢复机制

缺点

-- 低延迟高数据吞吐访问问题

• 比如不支持毫秒级

• 吞吐量大但有限制于其延迟

-- 小文件存取占用 NameNode 大量内存(寻道时间超过读取时间( 99% ))

-- 不支持文件修改:一个文件只能有一个写者(深入)仅支持 append 不支持修改(其实本身是支持的,主要为了空间换时间,节约成本)

收起
银行 · 2019-12-31
浏览1529

提问者

Tamic
数据库架构师某保险

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2019-12-30
  • 关注会员:2 人
  • 问题浏览:2243
  • 最近回答:2019-12-31
  • X社区推广