医疗大数据分析挖掘的数据质量如何保证?

参与8

1同行回答

docdoc项目经理长春理想
医疗大数据分析挖掘的数据质量主要从以下三个方面把控:1) 数据获取:这个过程要先问自己要收集哪些数据,大数据分析并不是对医院所有的数据都进行收集,而是相关的,有直接或者间接联系的数据,要知道哪些数据是对于战略性的决策或者一些细节决策有帮助的,分析出来的数据结果是有...显示全部

医疗大数据分析挖掘的数据质量主要从以下三个方面把控:
1) 数据获取:这个过程要先问自己要收集哪些数据,大数据分析并不是对医院所有的数据都进行收集,而是相关的,有直接或者间接联系的数据,要知道哪些数据是对于战略性的决策或者一些细节决策有帮助的,分析出来的数据结果是有价值的,这也是考验一个数据分析员的时刻。例如哪些数据可以得出信息对于一个临床诊疗是有帮助,或者是更好的实现辅助诊疗目标。在进行大数据分析规划的时候,一般是针对一个业务的目标进行精确的分析,比较容易满足业务的目标。
2) 数据整合:为了得到更加精确的结果,在大数据分析的过程当中,数据整合是关键的环节,数据整合是将从医院信息平台抽取的业务数据按照统一的存储和定义进行集成。医院信息化经过多年的发展,积累了很多基础性和零散的业务数据。但是数据分散在临床、辅助、管理等不同部门,致使数据查询访问困难,医院管理层人员无法直接查阅数据和对数据进行分析利用,数据整合需要综合不同格式、不同业务系统的数据。
3) 数据加工:医院原有的业务数据必须经过标准化处理后才能够迁入大数据平台。由于医院的大数据来自各个不同的业务系统,数据格式和标准不统一,很难对数据进行统一的管理和利用。一般大数据平台的建设都会针对结构化和非结构化数据建立不同的主索引数据,然后对源数据进行清洗后导入数据集。拥有或创造一个干净、结构良好的数据集是必须的。使用数据清洗软件工具可以帮助细化数据并将其重塑为可用的数据集。

收起
系统集成 · 2018-09-27
浏览1589

提问者

liminghe
软件开发工程师华正信息

问题来自

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2018-09-27
  • 关注会员:2 人
  • 问题浏览:2304
  • 最近回答:2018-09-27
  • X社区推广