在医院信息化建设中难免会遇到非结构化的数据,如部分电子病历数据,这部分数据基本都是信息孤岛一样的存在。有什么办法可以在成本较小的情况下对非结构化数据进行二次利用呢?
现阶段的确有很多医院信息系统的数据是非结构化的,特别是建设较早的系统。通常在建设数据中心或者集成平台时,有以下三种方法对非结构化数据进行二次利用:1.开发数据后结构化引擎,这种方法针对电子病历系统中有很多非结构化的大字段数据较为有用;2.利用数据离散建模工具和模型对非结构化数据进行拆分,并统计收集模型中关键的特征值,如果能够匹配,就对数据进行提取并再次利用;3.语义分析,这种方法需要有大数据样本和搜索引擎技术结合,通过自动化工具进行数据结构化并实现自动提取关键信息的数据。
收起对非结构化数据可以进行数据挖掘,利用数据仓库和数据挖掘技术对医疗影像数据进行挖掘分析,可为医院影像科的管理提供极大的决策帮助。
首先,需要建立医疗影像数据仓库。通过对医院PACS系统中数据的初步分析,确定数据仓库的主题,建立医疗影像数据仓库实例系统,包括多维数据模型的设计和数据抽取,同时运用数据仓库对多维数据集进行分析和利用可视化技术展示结果。
其次,利用关联规则对病人的检查项目进行分析,对病人检查信息表中的数据进行分析,提取出病人信息和检查项目,对数据整理后建立关联规则模型,得到有用的规则。