很难绝对的说必要还是非必要,根据你的题干部分描述,我的意见如下:
1、涉及到数据关联,检索查询,不论采用什么平台或技术,有一点绕不开:病人主索引系统,通过病人主索引,获得该病人在各业务系统的相关信息。有志于此的同行,可以关注了解PIX
2、你提到的数据存储极限,事实上,抛开影像数据,但看DB数据以及文本报告信息,以单家医院来看,总数据量占比很小,约莫在总存储量额15%左右,所以解决好影像数据的归档存储是问题关键
3、业内主流的PACS系统服务厂商,在影像归档存储方面各有诀窍,在选型中,能够实现影像数据单独存储,并支持在TG数据量级别下方便的实现近线或离线数据的检索查询即可
4、个人建议选择分布式存储,一方面是基于成本考虑,另一方面,医学影像归档存储服务遵循DICOM 3.0标准下,能够对病人影像实现标签,此时在PACS系统中通过优化检索查询方式,可以确保效率。关于检索查询,可以关联了解爬虫搜索引擎相关知识。