数据大集中服务器资源配置需求相对而言要求配置较高,作为数据的终点,为后期数据挖掘及分析的基础,无论是计算能力,还是IO性能都要求较高,所以从软硬件配置来看都需要较高的资源规划。首先,软件一定要是可以支持大型数据的架构,无论选择大型的warehouse,还是分布式的hadoop,这两种...
显示全部数据大集中服务器资源配置需求相对而言要求配置较高,作为数据的终点,为后期数据挖掘及分析的基础,无论是计算能力,还是IO性能都要求较高,所以从软硬件配置来看都需要较高的资源规划。
首先,软件一定要是可以支持大型数据的架构,无论选择大型的warehouse,还是分布式的hadoop,这两种架构从配置选择来说是不同的,一个是要求高配置,高集中的服务器设备,一个是靠节点集群数量增长的服务器配置,各有优缺点,至于最终选择,还是要根据业务来决定,个人感觉,目前这个题目,大型医院数据大集中平台,还是一个传统行业,更倾向于大集中的软件选择warehouse,这样应用变动相对较少。
其次,在硬件选择上,根据软件的选择,硬件也分为集中式服务器,比如小型机或者大型机等,优势就是系统稳定,可靠性高,独立的IO性能有一定优势;还有就是分布式服务器,相对于集中式服务器,可能配置要求没有那么高,比如使用hadoop类分布式数据库的话,普通X86服务器就可以,但无论是服务器还是OS的可靠性及稳定性都无法与小型机和大型机媲美。所以个人针对这个题目,还是倾向于小型机或者大型机系统。
前置的服务器可以考虑X86服务器或中低端小型机,靠软件HA或者应用集群保障可靠性。
收起