大数据平台 - 主题 - twt企业IT交流平台

问题
热度排序 时间排序

软件开发大数据平台·2022-02-07

pysx0503 · 第十区。散人　擅长领域：存储, 备份, 服务器

747 会员关注

所谓大数据。可以简单的理解为大的数据，大是大数据的一个特点。所谓大。不仅仅是数据量庞大，还涉及到方方面面。至于临床数据中心和大数据平台。我理解是这样的大数据平台可以包含临床数据中心。临床数据中心偏向于医疗专业方面的临床数据信息，但是大数据会涵盖更多的方面。...

软件开发大数据平台·2022-02-07

银行大数据平台·2021-12-27

haizdl · 大连　擅长领域：灾备, 存储, 服务器

1234 会员关注

大数据平台里面的数据有几个特点：1. 数据量巨大：海量2. 数据结构类型复杂多样：结构化、非结构化、半结构化 ...3. 数据功能分多个层次：基础数据，初步架构数据，深度加工数据，分析结果数据 ...4. 来源众多：内部各应用下沉的基础数据，外部引入的基础数据 ...正是因为以上这几...

赞同1

回答2

关注3

系统集成大数据平台·2021-12-25

大数据平台为什么不推荐采用k8s作为计算集群控制？

a5060963 · 民营500强企业　擅长领域：云计算, 容器, 容器云

2 会员关注

大数据是有状态的，k8s完美支持无状态

系统集成hbase·2021-12-25

奔跑的蜗牛 · 武汉家事易农业科技有限公司　擅长领域：数据库, 云计算, 服务器

61 会员关注

1: 写入太频繁量又大，的确需要产生那么多 flsuh task，IO 处理跟不过来（包括 disk 和 network），这种情况下会触发持续的 flush 波峰，加上文件数增加触发 compaction，那么就会严重，要么客户端做优化要么服务端做扩容（视情况而定可能需要迁移至 SSD 集群或者上万兆网卡）；2: 写入太频繁...

系统集成hbase·2021-12-25

wuwenpin · 南京　擅长领域：服务器, 存储, 云计算

256 会员关注

1、不要太大，也不能太小。我们设置的是128M2、一般128M会写入，但如果region太多,不到128M就会写入了3、WAL

系统集成hbase·2021-12-25

wuwenpin · 南京　擅长领域：服务器, 存储, 云计算

256 会员关注

1、官方建议200-300.但我们集群有1000个运行也正常。分裂太多系统不稳定2、合并、增加节点3、手工切分

系统集成大数据·2021-12-25

Mr刘先生 · 软通智慧　擅长领域：数据库, 关系型数据库, 数据库系统改造

1、在 HBase 中，当一个 region 达到一定大小时，会触发分裂操作，将该 region 分裂成两个更小的 region。在分裂过程中，HBase 会根据负载均衡算法，将新的 region 分配到集群中的某个 region server 上。这个过程是系统自动进行的，无需人为干预。2、为了保证分裂的 region 可以有...

系统集成hbase·2021-12-25

wuwenpin · 南京　擅长领域：服务器, 存储, 云计算

256 会员关注

1、多大开始分裂是可以设置的，系统默认10G开始分裂2、我们集群1W+ region，文件设置成20-30G

赞同

回答1