hbase - 主题 - twt企业IT交流平台

地市级大数据项目，如何在oracle、mysql、mongodb、hbase等数据库中进行选型？

关注3

软件开发数据库选型·2019-06-13

shangguanhaiyi · ustc　擅长领域：数据库, 数据库系统改造, 关系型数据库

9 会员关注

做地市级大数据项目，有能力的是不是上大数据平台，Hadoop平台上面 hbase ,hive 都会用到，结构化数据库推荐用mysql系数据库,成本最小。考虑后期mysql可能闭源，还有MariaDB.oracle，mysql 是结构化数据库mongodb,hbase 是key-value 数据库,非机构化数据库。...

赞同7

回答7

关注9

银行hbase·2020-02-11

两个独立的服务器，一台用HDFS，一台不用HDFS可以吗？HDFS和Hbase必须要装在同一台服务器上吗？

空kong · 某单位　擅长领域：大数据, 数据库, 大数据平台

3 会员关注

Hbase 运行在 HDFS 之上，每个 StoreFile 都被写成一个 HDFS 的文件，能理解 HDFS 的架构，它是如何存储文件，处理故障转移和复制块很重要大多数情况下， Hbase 将数据存储在 HDFS 之上，像 Hfile 和 WALs( 主要为了防止 RegionServer 出现故障 ) 都会存储在 HDFS 上， HDFS 提供对 Hb...

赞同1

银行集群·2020-02-18

从哪些方面可以判断HBase集群是否健康？

空kong · 某单位　擅长领域：大数据, 数据库, 大数据平台

3 会员关注

一个集群是否健康，大体可以从以下几个方面来判断 1 、单 region 的 storefile 数量是否合理 2 、 memstore 是否得到合理的利用，此项指标与 hlog 的数量和大小相关 3 、 compact 和 flush 的流量比值是否合理，如果每天仅 flush 1G 却要 compact 几十上百 G 就是明...

银行表·2020-02-11

zftang · 小白一枚　擅长领域：数据库, 云计算, 服务器

64 会员关注

无固定模式(表结构不固定)面向列稀疏性数据多版本数据类型单一高性能

获取HBase数据失败，提示RowTooBigException？

回答2

关注3

银行hbase·2020-02-11

空kong · 某单位　擅长领域：大数据, 数据库, 大数据平台

3 会员关注

原因分析FusionInsight C50SPC200 版本 hbase.table.max.rowsize 设置为 1073741824 。存在某条数据过长导致出现该异常，通过排查发现应用程序写入一条超过 1G 的 row 。解决办法修改 hbase.table.max.rowsize 。删除超过 1GB 的 row 的数据（可选）。...

hbase客户端的缓存什么时候更新？Master怎么处理？

银行hbase·2020-02-12

空kong · 某单位　擅长领域：大数据, 数据库, 大数据平台

3 会员关注

客户端首先通过 hbase:meta 表找到服务指定范围的行的 RegionServer ，在定位到是哪个 Region 之后，客户端直接联系 RegionServer ，而没有经过 Master ，然后发出读写请求。当 Region 被 Master 重新分配，或者某个 RegionSever 挂掉的时候，客户端会重新的查询索引表 hbase:meta ...

Hbase的rowKey怎么创建比较好？列簇怎么创建比较好？

银行hbase·2020-02-12

空kong · 某单位　擅长领域：大数据, 数据库, 大数据平台

3 会员关注

rowKey 最好要创建有规则的 rowKey ，即最好是有序的。 HBase 中一张表最好只创建一到两个列族比较好，因为 HBase 不能很好的处理多个列族。

除了HDFS之外，还有其他的文件系统可以让Hbase更好的使用吗？

银行hdfs·2020-02-12

空kong · 某单位　擅长领域：大数据, 数据库, 大数据平台

3 会员关注

HBase 和 HDFS 并不是强制的绑定在一起的， HBase 完全可以使用本地文件系统，比如 mac 的文件系统， Linux 的 ext3,ext2 等等，都可以运行 Hbase 。