doc
作者doc2021-07-23 16:23
项目经理, 长春理想

医疗行业大数据平台技术路线选择及日常运维难点在线探讨活动总结

字数 7974阅读 2394评论 0赞 1

近年来,随着云计算、大数据、物联网、移动互联网、人工智能等新兴技术不断涌现和成熟,加速了传统医疗行业与这些新兴技术的融合,其中以健康医疗大数据为代表的医疗新业态,不断的激发着医疗行业的发展。医疗行业通过实施大数据项目,可提供众多人群的精准医疗数据服务,为临床决策与科研、基因测序、新药研发和健康管理等提供海量存储及大数据分析能力。大数据分析技术使临床决策支持系统更智能,通过挖掘医疗文献数据建立医疗专家数据库,从而给医生提出诊疗建议,提醒医生防止潜在的错误,减少和降低医疗事故率。大数据通过全面分析病人特征数据和疗效数据,然后比较多种干预措施的有效性,减少过度治疗,以及治疗不足,找到针对特定病人的最佳治疗途径。

现阶段大数据系统最基本的组件是处理框架,处理框架和处理引擎负责对数据系统中的数据进行计算,依据所要处理的数据类型和数据状态分类,一些系统可以用批处理方式处理数据,一些系统可以用流方式处理连续不断流入系统的数据,另外还有一些系统可以同时处理这两类数据。经过对几种大数据处理框架和处理引擎的比较,结合医院现有应用系统的建设情况和数据量的规模以及数据类型的复杂度(医疗数据包括结构化和非结构化还有半结构化数据,数据类型多种多样,有的数据适合批处理,而有的数据适合流处理)如何进行技术路线的选择以及项目落地后日常运维难点如何解决?都是需要经过详细的对比与实践。

twt社区特意邀请了来自某三甲医院的专家和医疗行业的专家进行线上交流分享答疑,帮助大家解决在医疗行业大数据平台建设项目的路线选择难点、日常运维难点。

Q:医院建设大数据项目面临风险有哪些?如何应对?

医疗数据安全关系到患者隐私、技术研发等重要、敏感领域,一旦发生数据泄露将对患者群体、社会稳定造成严重影响,对于数据安全的风险如何应对?

doc** 项目经理 , 长春理想

【A】 临床研究数据安全风险。临床研究数据一般是指由医院、学术研究机构和医疗企业发起的,主要用于药物、医疗器械、医疗诊断的科学研究,所涉及的基本人口学资料、诊断信息、病例及患者报告等数据信息。参与临床研究的医患及 有关信息,在通过专线、互联网线路等途径进行传输时,或是在医疗机构进行存储和使用等过程中,都面临着诸多数据安全风险。另外还存在远程医疗数据安全和医疗中心数据安全问题,针对这些问题需要从多方面进行管控:

1) 包括医疗健康大数据在使用的过程中,涉及到个人隐私数据的分析利用、流通等都应受到严格管控,无论从个人角度还是使用者角度,都需要获得授权许可。

2) 构建以患者为中心的医疗数据安全防护体系。现有的隐私安全防护,大多只是注重脱敏和匿名保护,不是全方位体系。需要加强构建以患者为中心的个人医疗信息风险评估和防护体系,覆盖信息录入、个人隐私管理、加密存储、访问控制等多个环节。

3) 加强个人信息保护立法。一方面,公民要有充分认知,应当学会对自身隐私的保护。另一方面,对违法行为要有足够的惩治,打击个人信息的不当泄露和非法利用。

spgoall** 信息管理部部长 , 和祐国际医院

【A】 首先要对数据安全风险进行识别,大多数风险应该对机密性、完整性、可用性这三个特性造成威胁的范围内,在使用数据的时候应该评估数据集的安全风险,最好能依据某些标准对数据进行分级,在降低危害性和增加可用性上做平衡,不同级别有不同应对措施,识别敏感信息,对这些信息进行合适的脱敏处理,同时建议大数据平台要做三级等保测评。

Q:数据治理得思考?

集成平台,数据中台融合整个内部的全部数据、打通数据之间的隔阂屏蔽数据孤岛问题、数据标准与口径不一致的地方、统一数据规范的设计规范、解决数据口径不一致的问题、数据质量老大难的问题、元数据管理的问题、数据提供统一的出口与统一的入口问题。有很多类似的问题,不管是在十五年前、十年前、五年前、今天,数据中台、数据平台、数据仓库面临的问题基本上是一致的。有没有想过一个问题呢,十几年前的企业级数据仓库实施项目、数据平台建设项目、今天的数据中台实施,不管是在哪个阶段,很多实施中遇到的问题都是基本一致的。这么多年下来 DAMA 也一直在布道数据治理的方法论与认证等,但是遇到的问题还是一样的,多年反复出现而不能解决,虽然无趣,但还是得思考造成这些问题的核心要素是什么?

doc 项目经理 , 长春理想

【A】 数据标准是为了规范对数据的统一理解,促进数据共享,增强跨团队协作中对数据定义与使用的一致性,降低沟通成本。数据标准通常包括组织架构、标准制度、管控流程、技术体系四个方向,应用统一的数据定义、数据分类、编码规范,以及数据字典等。数据标准可以考虑如下: 组织架构:确定元数据、主数据、交易数据涉及的管理决策、数据业主、运营、质量、消费等团队或岗位角色,以及所涉及的责权利。 标准制度:围绕源端数据制定分类、格式、编码等规范,制定日志、报警、性能指标等数据标准,这里的标准应该与技术规范区别开。 管控流程:要对数据管理的供应、变更、申请、共享、质量、运营等流程进行规范化、线上化。 技术体系:综合考虑平台架构、接口规范、应用场景等,围绕数据的“采存算管用”建立数据平台。 数据质量管理是指针对数据从计划、获取、存储、共享、维护、应用、消亡生命周期的每个阶段里可能引发的数据质量问题,进行识别、度量、监控、预警等管理活动,并通过改善和提高组织的管理水平提高数据质量。

spgoall 信息管理部部长 , 和祐国际医院

【A】 数据治理是战略层面,DAMA强调的是数据管理,核心还是在数据质量上,参照医疗质量管理体系,不妨可以试试用PDCA只数据质量改进,每次改进一点点,积少成多,不断形成或修正数据管理制度和数据标准,整个医院数据管理体系就会逐步成熟。

Q:医疗信息化考核治标?

医疗信息化本身的复杂性,加之医疗项目管理的高要求,成就了医院信息化项目的高风险性。选型不力、沟通不畅、需求变更等等,都可能导致信息化项目工期拖延,甚至完全失败。而这其中更大的风险在于,我们看似理性的决策背后,其实蕴含着巨大的认识误区和执行陷阱。请专家,谈谈信息化项目成功的考核标准,信息化项目kpi,客观评价

doc 项目经理 , 长春理想

【A】 1)项目进度的估算是否准确:对于估算是否准确是对项目进度计划安排影响最大的一个因素; 2)关键资源是否应用在了关键路径上:在进度计划安排中是否优先保证了项目关键路径上的资源,是否通过人员技能矩阵对项目关键资源进行分析和安排。 3)项目中的资源是否充分利用:由于存在关键路径和岗位角色矩阵,所以项目中人力资源往往并不能充分利用起来。 需求的确定与变更,医院信息化项目需求的确定是项目建设的依据,而需求的变更必须要项目组成员一致通过才能变更, 把具体的需求落到纸面上,双方签字确认,严格按照需求执行,双方的责任划分清楚,如需更改改造进度需要上会商议,商议通过按新需求执行,从而保障项目的顺利进行。

spgoall 信息管理部部长 , 和祐国际医院

【A】 1、这里指的信息化项目应该是指软件项目或集成项目 2、成功的标准,首先是看是否符合合同规定的验收条件,这是客观的指标,其次是用户满意度。 3、现实中,很多项目,特别是软件项目用户满意度是最难提升的,原因在于需求变更频繁,公司响应变更太快,用户会觉得很随意,后续会有更多的需求变更,公司不响应或响应不及时又感觉公司不重视,所以如何把握需求变更响应的度是最难的。

Q:如何建设适合各家医院的大数据平台,其条件有哪些?

不同医院的信息化程度各异,如何选择适合自身的大数据平台,平台有赖与医院各信息系统产生的数据,如果数据质量不高必然会影响大数据平台的抽取,人工智能分析和数据挖掘的效果就会大打折扣,所以应该立足实际,具备了建立大数据平台的条件再行考虑,那么这个条件具体来说有哪些呢

doc 项目经理 , 长春理想

【A】 医疗大数据分析平台由数据获取、数据整合,数据加工和数据展现四个模块组成。需要结合实际情况进行分析,建设医疗大数据分析平台能否实现预期的效果,是否可以做到以下这四个方面。

1) 数据获取:在这个阶段要回答以下几个问题,包括要收集哪些数据,哪些数据是对于战略性的决策或细节决策有帮助的,哪些数据分析出来的结果是有价值的,哪些数据得出的信息对于一个临床诊疗是有帮助,哪些数据能更好的实现辅助诊疗目标等。

2) 数据整合:为了得到更加精确的结果,在大数据分析的过程当中,数据整合是关键的环节,数据整合是将从医院信息平台抽取的业务数据按照统一的存储和定义进行集成。医院信息化经过多年的发展,积累了很多基础性和零散的业务数据。但是数据分散在临床、辅助、管理等不同部门,致使数据查询访问困难,医院管理层人员无法直接查阅数据和对数据进行分析利用,数据整合需要综合不同格式、不同业务系统的数据。

3) 数据加工:医院原有的业务数据必须经过标准化处理后才能够迁入大数据平台。由于医院的大数据来自各个不同的业务系统,数据格式和标准不统一,很难对数据进行统一的管理和利用。一般大数据平台的建设都会针对结构化和非结构化数据建立不同的主索引数据,然后对源数据进行清洗后导入数据集。拥有或创造一个干净、结构良好的数据集是必须的。使用数据清洗软件工具可以帮助细化数据并将其重塑为可用的数据集。

4) 数据展现:数据展现即数据可视化,为方便医护人员、患者和管理人员理解和阅读数据,而采用相关技术按业务规则进行的数据转换。这就要求医院相关的业务规则都是已经确定好的,这些业务规则可以帮助数据分析员评估他们的工作,将数据进行分析得出有价值的结果。

spgoall 信息管理部部长 , 和祐国际医院

【A】 可以一点带面,先从病案首页筛选出贵院前10的病种,然后匹配响应的临床科室团队,找到有意向做数据分析的团队,然后按单个病种组织数据集,还可以利用临床团队的领域地位建立多中心数据集,利用大数据平台实现他们的需求。项目到一定阶段后要总结,最好能有一些文章发表,以此再对其他临床科室宣传,再进行第二轮病种筛选和推进……

Q:his系統掛載太多,找不到問題怎麼辦?

我們的his系統掛載了太多的非醫療必要性的系統,如果這些系統當掉很難排查具體的問題。就這個情況想要做一個管理方案

doc 项目经理 , 长春理想

【A】 多数his系统都是大而全的发展状态的,当his系统包括的子系统多时出问题就不易于排查,最好是把这些非必要的系统分离出去独立运行,如果his系统与非必要的系统有数据之间的交互最好采用通过接口服务器互连的方式,这样能明确出问题的源头,易于问题的排查与处理。

spgoall 信息管理部部长 , 和祐国际医院

【A】 HIS挂载太多插件是不可避免,要对这些插件做分类,把每个插件的配置信息文档化,甚至系统配置化,如强制挂载的如医保平台下发的医保稽查插件,只能用同步调用,非强制的可以用异步调用方式,调用日志要专门存储,以便跟踪排障,服务类插件则应部署在ESB,受到ESB管理,可以随时查看 服务调用具体日志,定位故障。

Q:医疗大数据平台重视算法模型还是应该重视应用场景?

目前医疗大数据平台都如火如荼的在全国推广建设和应用,那么针对数据处理的角度放在大数据平台上会有两个关注点,一是关注算法模型,使最优化的算法模型对数据的处理产生较为理想的结果,另一个是关注大数据平台的应用场景,使得其能够解决更多的问题,二者之间如何来平衡

doc 项目经理 , 长春理想

【A】 目前,医疗大数据的应用场景主要包括临床决策支持、健康及慢病管理、支付和定价、医药研収、医疗管理等,服务对象涵盖居民、医疗服务机构、科研机构、医疗保险机构、公共健康管理部门等。而 算法模型是为了医院在数据处理时产生更为理想的结果, 算法模型是服务于应用场景的,二者相辅相成。

spgoall 信息管理部部长 , 和祐国际医院

【A】 有应用场景也就是有应用需求,分析需求后才能知道数据元,根据数据元产生数据集,拿到相关的数据后才能进行数据处理,目前很多医疗大数据平台可以用多种算法试算结果,再对比各种算法的优劣后推荐最优的几种。

Q:如何判断医疗大数据平台供应商?

目前医院都在做集成平台、临床数据中心的等信息化建设。市场上的大数据供应商也很多,hadoop、spark的等等都有,如何去判断大数据平台供应商的技术实力以及技术路线是否能满足医院业务的实际需求?其次,为提高数据质量,而修改业务系统,具体要规避哪些难点?是从集成平台上做数据规范还是从根源上去解决,根源上解决的话对业务系统的修改牵连甚广。

doc 项目经理 , 长春理想

【A】 1、选择大数据平台供应商,首先需要考察供应商的安全意识,对数据的安全管理、对数据的合规利用理念和方法等;其次要考虑的是供应商的技术实力,有成功案例,能提供持续的服务,具有良好的行业用户口碑等。

2、对于医疗大数据平台供应商,不仅要关注其大数据处理技术能力(如数据库技术、搜索、结构化处理等),还要关注其对医院信息系统的熟悉程度、网络安全、数据统计、科研项目等方面的经验。

3、医疗大数据平台建设不同于传统的信息系统建设,对于供应商的技术实力和研发团队要求较高。供应商研发团队中除了高水平的IT工程师,一般还应配备一定数量的具有临床工作背景员工。因为原始数据归集过程中的数据归一、非结构化数据的结构化处理等,需要大量的临床背景知识。如果缺乏临床知识支持,很难建设高质量的大数据平台。

Q:医院进行数据标准化建设的必要性?能带来哪些价值?

医院进行数据标准化建设的必要性?能带来哪些价值?

doc 项目经理 , 长春理想

【A】 医院进行数据标准化的建设是大数据分析平台建设的基础,随着医院信息化系统建设逐渐升级,医院信息系统功能不断完善和增强,各子系统分布在医院管理各个层级,涵盖门诊挂号、门诊收费、药房药库、一体化医生站、一体化护士站、LIS系统、PACS系统、RIS、HRP、远程医疗、OA等方面,为了顺应医院的战略目标,改善工作效率,信息系统不断升级和完善,为患者提供有序、安全的医疗服务,同时各子系统分散全院级、部门级应用,同时数据交互也不完全数据互通,因此,医疗数据不能统一现象问题。 为了掌握医院的运营状况和经营决策支持,提升医院科学化、精细化管理要求,因此需要在各系统间建立数据标准化,形成系统与系统间数据互联互通。 医院数据标准化建设带来价值: 1)规范软件开发的标准化,降低软件维护成本; 2)提升信息数据标准化水平,各系统间互联互通; 4)规范软件用户的操作,减少工作中误当和理解分歧等,确保数据完整性;

Q:运维的日常工作、开发平台及工具?

业务运维工程师的日常工作包括:

1、监控线上的服务质量

2、响应异常/处理突发故障

3、在线发布/升级产品和相应产品线的研发和测试协调处理产品问题

4、基于工作中的问题和数据分析进行抽取,将运维经验理念落地沉淀为方法论/工具/系统/平台,并制定相关的改进计划,在各个技术方向上落地实现,最终反馈回运维工作中,提高运维本身的效率和产品的价值。

doc 项目经理 , 长春理想

【A】 医疗大数据项目经过系统试运行和最终验收后就进入运维阶段了, 项目所涉及到的硬件设备按厂商的规定进行保修(一般是三年)、软件产品按合同约定进行保修。 此次大数据项目的实施包括基于spark开发的医疗大数据分析系统,以及为大数据分析系统做支撑的服务器、存储、网络及安全设备等已经从实施进入运维阶段。

运维工作需求分析: 一流的运维服务体验来自于以用户服务为核心的策略,如何保障医疗大数据分析系统稳定的运行是运维工作的重点,经过与用户的沟通确定了如下的用户需求:

1. 提高运维工作效率,运维的及时性,准确性。

2. 运维人员绩效考核,有利于提高运维工作效率,有利于运维工作的创新,有利于提高工作的积极性和主动性。

3. 巡检是运维工作的日常内容。确认设备的巡检周期,建立并执行应用系统巡检制度,制定巡检工作流程单,按流程按时按要求对设备进行巡检。

运维方案的制定: 运维方案包括组织架构,运维要求,运维方式,管理制度共四个方面。

组织架构: 以总经理牵头,下设运营部、市场部和技术部;在运营部下设人事、行政、商务、采购、财务等部门;在市场部下设销售部、市场部、产品部和客服部;在技术部下设系统集成部、运维管理部、售前方案部等部门。

运维要求: 根据出现问题的紧急程度,确定非常严重、严重和一般三个等级。根据问题的紧急程度确认响应时间,2个小时以内、4小时以内、8小时以内,

运维支持的方式包括现场支持、电话邮件支持和远程协助支持。

运维方式: 根据运维工作的需求和运维响应时间要求决定建设完整的运维计划并确定服务的标准,以现场软硬件巡检为主,增强运维计划的执行力,下面是运维工作流程:

建设完整的运维计划:在整个运维过程中,计划是整个工作流程的核心,按照计划先行的原则,依据本年度工作计划制定分项工作计划和时间维度计划,并按流程、按计划进行实施和保障。

现场巡检的重要性:现场巡检计划是运维工作计划的重点,通过现场巡检能够发现系统薄弱环节、关键业务节点、存在的隐患,尤其是对制定应急预案及备品备件计划至关重要。

执行力的重要性:运维计划的执行是运维工作的重点,在运维计划执行过程中,应严格按照流程规范开展运维,并注重控制以降低运维风险。针对运维执行情况,应定期向用户进行反馈。

服务标准:签订售后服务承诺函与用户约定服务级别,对于所承诺的服务级别包括提供的资源(备品和备件等)、提供的方案应严格按约定执行;

管理制度: 包括运维工作流程管理,机房环境巡检制度,服务器、存储、网络及安全设备等巡检制度,应用系统巡检制度等相关内容。

Q:医院如果要建设大数据项目有哪几种技术路线可以选择?

应该如何结合医院的需求场景、医院现有数据的特点以及对大数据处理速度的要求选择合适技术路线?

doc 项目经理 , 长春理想

【A】 目前主流的大数据处划框架包含以下几种,用户需要结合自身的要求和特点进行选择: Apache Hadoop是一种专用于批处理的处理框架。Apache Hadoop及其MapReduce处理引擎最适合处理对时间要求不高的非常大规模数据集。通过非常低成本的组件即可搭建完整功能的Hadoop集群,使得这一廉价且高效的处理技术可以灵活应用在很多案例中。

Apache Storm是一种侧重于极低延迟的流处理框架,也许是要求近实时处理的工作负载的最佳选择。该技术可处理非常大量的数据,通过比其他解决方案更低的延迟提供结果。

Apache Samza是一种与Apache Kafka消息系统紧密绑定的流处理框架。虽然Kafka可用于很多流处理系统,但按照设计,Samza可以更好地发挥Kafka独特的架构优势和保障。该技术可通过Kafka提供容错、缓冲,以及状态存储。

Apache Flink是一种可以处理批处理任务的流处理框架。该技术可将批处理数据视作具备有限边界的数据流,借此将批处理任务作为流处理的子集加以处理。Flink是一个新兴的项目存在一定的局限性。

Apache Spark是一种包含流处理能力的下一代批处理框架。与Hadoop的MapReduce引擎基于各种相同原则开发而来的Spark主要侧重于通过完善的内存计算和处理优化机制加快批处理工作负载的运行速度。Spark是多样化工作负载处理任务的最佳选择。Spark批处理能力以更高内存占用为代价提供了无与伦比的速度优势。对于重视吞吐率而非延迟的工作负载,则比较适合使用Spark Streaming作为流处理解决方案。

**

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

1

添加新评论0 条评论

Ctrl+Enter 发表

本文隶属于专栏

活动总结
活动总结是社区交流活动内容的总结及延伸,为大家提供了社区专家们丰富且高水平的理论知识、实践经验以及常见问题的最佳解决方法,非常值得大家收藏学习。

作者其他文章

相关文章

相关问题

相关资料

X社区推广