在医院信息化建设中难免会遇到非结构化的数据,如部分电子病历数据,这部分数据基本都是信息孤岛一样的存在。有什么办法可以在成本较小的情况下对非结构化数据进行二次利用呢?
现阶段的确有很多医院信息系统的数据是非结构化的,特别是建设较早的系统。通常在建设数据中心或者集成平台时,有以下三种方法对非结构化数据进行二次利用:1.开发数据后结构化引擎,这种方法针对电子病历系统中有很多非结构化的大字段数据较为有用;2.利用数据离散建模工具和模型对非结构化数据进行拆分,并统计收集模型中关键的特征值,如果能够匹配,就对数据进行提取并再次利用;3.语义分析,这种方法需要有大数据样本和搜索引擎技术结合,通过自动化工具进行数据结构化并实现自动提取关键信息的数据。
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30