大型的数据整合平台如何将异构化数据统一整合,是使用传统数据库技术还是采用其他方案
收起目前各种类型的数据库在数据平台上都有一定的实践,数据平台的选择一般从数据量和负载两个层面来考虑:
从医疗大数据的实际情况看,医疗领域除影像系统外其实很难说有真正意义上的“大”数据,一般来讲都在几十__TB__到数百__TB__之间,有些规模比较小的医院可能只有几__TB__;这些虽然都被称作数据平台或大数据平台,但在实际运行中有很大的不同。而不同医院间数据平台业务负载的区别就更大。_
一般来讲在数据量较小的情况下,各种数据库功能性上都没有问题,但__NoSQL__数据库或分布式数据库在运维管理上会相对复杂一些;一般的关系型数据库(类似__oracle__)是以行方式进行数据操作,这种方式在几十__TB__的数据量上会有比较一定的效率问题,在这时候就可以开始考虑使用以列为方式操作的__NoSQL__数据库,以提升数据检索、计算的效率;在业务负载较重的情况下,如果考虑到单机性能无法满足业务需求,则可以考虑使用分布式的部署方式,利用多台机器并发以达到提升运行效率的目的。_