大数据存储
大数据存储
“大数据” 通常指的是那些数量巨大、难于收集、处理、分析的数据集,亦指那些在传统基础设施中长期保存的数据。大数据存储是指大数据的存储问题。
“大数据” 通常指的是那些数量巨大、难于收集、处理、分析的数据集,亦指那些在传统基础设施中长期保存的数据。大数据存储是指大数据的存储问题。

热点

大数据存储·2017-08-08
silencely · 阿里 擅长领域:云计算, 大数据, 数据库
89 会员关注
HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,适用于结构化的存储,底层依赖于Hadoop的HDFS,利用HBase技术可在廉价PCServer上搭建起大规模结构化存储集群。因此HBase被广泛使用在大数据存储的解决方案中。为何使用HBaseHBase的优点:列可以动态增加,并且列为...(more)
浏览1919
评论2
系统集成云计算·2017-08-07
tt_45 · eenese 擅长领域:云计算, 备份, 存储
333 会员关注
Hadoop Distributed File System (HDFS) is an Apache project. It's a file system which is used to store the initial and 'reduced' data once the data is processed using MapReduce. Google File System (GFS) was the database created by Google initially to ...
政府机关分布式存储·2017-07-12
myciciy · 某金融科技公司 擅长领域:服务器, 存储, 灾备
1239 会员关注
请问业务是什么应用场景?现在用的什么存储,每年数据增长很快啊.
互联网服务大数据·2017-07-05
美国队长 · Alibaba 擅长领域:大数据, 大数据平台, 数据库
512 会员关注
可以从你的底层存储方式着手,比如你的30亿数据是否可以划分成3层,内存区,热存储区,冷数据区,新的数据过来,先放内存,然后后台进程自动对内存中的数据跟热区数据进行比对是否存在,设置数据降级机制,哪些数据可能用的比较少可以先从内存中降级到热存储区如果你想用hbase的话,建议你根...
银行大数据平台·2017-06-22
rein07 · 某证券 擅长领域:人工智能, 大数据, 机器学习
584 会员关注
hive上对数据的修改和删除确实比较困难,但是hbase支持的比较好的。现在cloudera推出一款新的产品,kudu,也可以试一试。
保险MySQL·2017-06-02
liucj2004 · undefined 擅长领域:数据库, 数据库系统改造, 关系型数据库
441 会员关注
这里就简单说一下题主说的几个数据库中,mongodb优势的地方vs hbasehbase是基于row key存储宽列的一款nosql,乍一看结构类似mongodb的_id主键和可变长的列数量。具体的原理和区别这里不展开。mongodb的优势在于轻量化部署非常简单,不用像hbase那样搭一整套hadoop集群,即开即用...
银行数据卷·2017-04-28
sjk000 · 456 擅长领域:数据库, 云计算, 大数据
87 会员关注
先把这个集群停了,然后把配置文件里面涉及这个机器的配置注释掉,然后重启集群,最后再把这个机器加上去
银行Ceph·2017-04-23
美国队长 · Alibaba 擅长领域:大数据, 大数据平台, 数据库
512 会员关注
从hdfs角度来看,他都是以块的形式存储,也就是其最小存储单元,其次你可以指定存储对象是二进制的视频还是普通字符的文本等,在他眼里都是block,然后这些block通过namenode进行管理就行了...
银行Ceph·2017-04-23
美国队长 · Alibaba 擅长领域:大数据, 大数据平台, 数据库
512 会员关注
我个人的观点是,首先hdfs是因为有了上次mapreduce的计算才衍生出的一个存储数据的模式,而ceph可以理解为 一个操作系统型的文件系统升级版,
银行Ceph·2017-04-21
jxnxsdengyu课题专家组 · 江西农信 擅长领域:存储, 灾备, 双活
1055 会员关注
双活数据中心基础软件架构,也就是基于软件的存储架构,在企业并行文件系统这块,我觉得还是首选GPFS。GPFS-FPO、HDFS、Ceph都是分布式文件系统的代表。HDFS是开源的分布式文件系统,是专门为Hadoop这样的大数据计算而生的。在处理离线批量的大数据上,有着天然的优势。但是HDFS处...

描述

“大数据” 通常指的是那些数量巨大、难于收集、处理、分析的数据集,亦指那些在传统基础设施中长期保存的数据。大数据存储是指大数据的存储问题。
“大数据” 通常指的是那些数量巨大、难于收集、处理、分析的数据集,亦指那些在传统基础设施中长期保存的数据。大数据存储是指大数据的存储问题。
X社区推广
  • 提问题