关键词:
CDR
数据仓库
ETL
摘要:
随着大数据和物联网时代的到来,数据的产生将以指数级的速度递增,机器产生的数据数量将数倍于人工记录数据,甚至最终取代人工记录数据。我国医疗信息化经过多年的建设和发展,积累了众多宝贵的数据资源,有能力的大型三甲医院正在从中获取巨大且未知的财富,而县级医院由于技术实力、资金投入、政策支持等问题,对于所产生和记录的医疗数据很难进行二次利用,甚至连整合都存在种种困难。县级医院数据的使用仍然处于比较原始的层次,比如手工统计,手工查询等。而以后海量的医疗数据用这种方式和传统的操作性数据库无法完成相应的提取和分析展示工作。需要针对医疗数据进行有效的汇总集成,构建以统计分析和数据挖掘等等为目的的数据仓库,进而形成医院的临床数据中心。临床数据中心(Clinical Data Repository,CDR)是以电子病历为核心的医院信息系统中不可缺少的一项,它为精准医疗、精细化管理、闭环管理、质量控制等等医院未来竞争力集中体现的这些管理手段提供了最最基础的数据支撑。及早建立并及早积累本院的知识库,丰富数据,为下一个人工智能时代的到来做好准备。建立临床数据中心的方式多种多样,目前最好的方式是所有临床信息一体化,在10年前这种一体化的技术还不成熟,一个公司没有精力做到大而全,但是现在这个趋势越来越明显,未来10年是一体化信息的蓬勃期。不过现阶段综合考虑人财物,本论文建立县级医院临床数据中心的方式使用归档集中式数据仓库,这种方式最符合实际需要也最容易实现。本论文以临床工作中的一项问题为任务建立高血压管理数据仓库,便于临床分析。具体说,本论文的主要工作有以下几个方面:(1)分析目前临床数据中心的建立方法,确定合适的数据仓库建立方式。(2)搭建开发环境:数据库MySQL 5.5,数据库前端工具MySQL Workbench CE 6.3、Navicat 11、HeidiSQL 9.5.0,Windows10 64 位操作系统。(3)按照模型规划建立以高血压管理为例的数据仓库(4)建立本临床数据中心常用维度表,支持多种标准,例如:年龄、时间、性别等,常用维度表是通用的,各个数据仓库均能使用。(5)借用人口代码标准规范对于缺失值和未定义编码处理的思想解决业务数据库中缺失值和新定义编码转换问题。(6)业务数据与数据仓库转换映射规则的可扩展设计。(7)自主构建MySQL自定义异常处理机制。本论文也为未建立集成平台的医院提供一种建设临床数据中心的思路,不是说只有建立了集成平台才能建立CDR,以实际应用为导向,建立各个数据仓库,不盲目求大而全,最大程度节约建设资金。