银行大数据大数据平台数据强一致性

大数据底层保持数据强一致性是如何实现的？

参与11

3同行回答
全部行业
全部行业 互联网服务 证券 银行
|
按赞同排序
按时间排序

sxtycxx 解决方案经理人工智能（计算机视觉）

大数据底层的数据强一致性是通过HDFS的分布式架构中的冗余副本策略和心跳检测机制实现的，
1、冗余副本策略：HDFS处理节点失效的一个方法就是数据冗余，即对数据做多个备份，在HDFS中可以通过配置文件设置备份的数量,默认是3副本，只有数据在3个副本上均完成写成功，才返回
2、心跳机制：检测节点失效使用“心跳机制”。每个 Datanode 节点周期性地向 Namenode 发送心跳信号。 Namenode 通过心跳信号的缺失来检测这一情况，并将这些近期不再发送心跳信号 Datanode 标记为宕机，不会再将新的 IO 请求发给它们。
N： 3 (数据备份的数目)
W： 1 （数据写入几个节点返回成功），默认是1，
R： 1 （读取数据的时候需要读取的节点数）
W + R < N

互联网服务 · 2018-12-28

浏览2894

查看赞同的人

我爱大锅饭系统运维工程师银行

个人觉得您提的问题不是很清楚，您是说底层数据各副本之间的数据一致性还是什么意思？

银行 · 2018-12-29

浏览2634

rein07系统架构师某证券

Hadoop没有办法保证所有数据的强一致性，但是通过副本机制保证一定程度的一致性，如果某一个datanode宕机，将会在其他datanode上重建一个副本，从而达到副本一致性的目的，且在写入的时候可以采用一次写入多个副本的方式保证即使某个副本对应机器挂掉，也不影响整个数据。

证券 · 2018-12-28

浏览2799

问题来自

活动 - 大数据时代企业的精准化和个性化管理及服务实践在线答疑

相关问题

国产数据库是否能满足高可用，数据复制强一致性的需求？

金融机构可以采取哪些措施来保障大数据时代下的数据安全？

中小银行的数据安全分类分级如何做？

传统金融数据如何转大数据平台？

互联网医院的建设中，如何规划大数据平台的架构？

相关资料

大数据湖体系规划与建设方案

“十四五”大数据产业发展规划

构建RAC架构及异地单机Data_Guard实施文档

头豹：2022年中国大数据产业一级市场纵览

Ansible运维管理平台部署、维护与调优

相关文章

迈入ChatGPT时代商业银行AI应用的发展趋势分析

大数据平台技术选型及架构设计

大数据时代下，金融行业数据安全防护面临挑战与落地措施探讨

河南农商联合银行招大数据风控、软件开发、网络安全等专业人才(郑州）

中小银行大数据平台建设实践分享

问题状态

发布时间：2018-12-28

关注会员：4 人

问题浏览：4442

最近回答：2018-12-29

关于TWT 使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们
© 2024talkwithtrend — talk with trend,talk with technologist 京ICP备09031017号-30

X社区推广