医疗大数据平台不同的建设路线底层基础架构设计时有什么要求?

目前医疗大数据平台大多采用HADOOP+MapReduce、内存数据库(以SAP HANA为代表的)以及图数据库(GP为代表),这几种模式在底层基础架构构设计时有何区别?

2回答

Dell_zhangcanDell_zhangcan  架构师 , 戴尔科技
在大数据平台建设中,无论是 hadoop , mapreduce 只是大数据平台中的技术细节,只要是能满足业务需求的采用那种技术路线都是可以的。如果是规划底层的基础构架,灵活性是首先要考虑的问题。目前大数据相关技术发展很快,开源的 hadoop,spark 等,公有云 AWS , alibaba 等也有相关的...显示全部

在大数据平台建设中,无论是 hadoop , mapreduce 只是大数据平台中的技术细节,只要是能满足业务需求的采用那种技术路线都是可以的。如果是规划底层的基础构架,灵活性是首先要考虑的问题。目前大数据相关技术发展很快,开源的 hadoop,spark 等,公有云 AWS , alibaba 等也有相关的云服务, IBM, 医度云等专业务的 ISV 也可以提供各细分行业的大数据软件和服务。在规划大数据平台时要充分考虑技术的发展,我们自己的平台要能适应这些发展,比如涉及敏感数据的需要自建平台或用私有云平台来承载,一些公开数据可以直接采用云服务,我们的平台从整体上看可以充分利用私有云和公有云的优势,在满足数据安全的前提下从平台层面打通公有云和私有云,整合两种云的优势,更好的满足业务需求。

收起
 2022-03-10
浏览175
zyp8365zyp8365  高级工程师 , 广东省中医院
底层基础架构设计不仅要考虑技术因素(性能、一致性要求、SQL兼容性要求),也要考虑包括架构产品的生态成熟度、应用架构适配度、团队适应度等非技术因素。Hadoop+MapReduce是典型的分布式文件系统+分布式计算的技术框架,其组件HDFS就是典型的分布式存储架构,分布式存储架构更为...显示全部

底层基础架构设计不仅要考虑技术因素(性能、一致性要求、SQL兼容性要求),也要考虑包括架构产品的生态成熟度、应用架构适配度、团队适应度等非技术因素。
Hadoop+MapReduce是典型的分布式文件系统+分布式计算的技术框架,其组件HDFS就是典型的分布式存储架构,分布式存储架构更为适合其技术体系。
内存数据库其主要的设计目标是为了解决高并发低时延的数据管理需求,依靠内存来存储数据。从存储速度来说,CPU寄存器>CPU缓存>DDR DRAM>持久型内存>NAND SSD>磁盘驱动器(HDD)>磁带,内存数据应该使用DDR DRAM或持久型存储,区别在于DRAM目前为易失性存储,使用时速度较高,但是应该要充分考虑业务类型和备份容灾方案,保证在极端情况下业务业务连续性,持久型内存相对来说速度较慢,但是非易失,容量和价格也占优势。
图数据库根据其图存储和处理方式分为不同类型,其底层的存储架构也要视图数据库采用的技术类型而选择与之适应的存储类别。
另外,值得提出的是,不管是何种存储架构,要注意存储的物理块要与文件系统或数据库中的逻辑块大小上要适配,减少同一数据操作频次。而且在基础架构设计时,也要关注业务类型、成本和投入的影响。

收起
 2022-03-09
浏览190

提问者

wangdd
系统工程师河北省人民医院
擅长领域: 存储大数据云计算

问题来自

分布式关系型数据库选型优先顺序调查

发表您的选型观点,参与即得50金币。

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2022-03-03
  • 关注会员:3 人
  • 问题浏览:639
  • 最近回答:2022-03-10