关键词:
新农合
数据仓库
关联规则
数据挖掘
离群数据
摘要:
自2003年新型农村合作医疗制度在余杭区试点以来,一套针对新农合的信息管理系统被开发使用并不断得到完善,系统虽已汇集大量新农合相关的数据,但是,系统仍缺乏挖掘数据背后隐藏知识的功能,导致“数据爆炸但有效信息贫乏”情况的出现。基于数据仓库和数据挖掘技术的决策支持系统是数据库领域的研究热点,可有效解决上述问题。 本文根据余杭区新农合管理的实际情况,在研究了数据仓库和关联规则数据挖掘的基础上,建立了适合余杭区新农合管理的数据仓库,着重研究了新农合居民疾病风险规则挖掘和保险费用离群数据挖掘。论文完成的主要工作如下: 1.分析了数据仓库体系的基本原理,并针对余杭区现有新农合管理系统的数据库特点和新农合管理实际需求,采用SQL Server 2005构建了面向数据挖掘的数据仓库。 2.分析了关联规则挖掘算法的工作原理,针对Apriori算法的局限性和新农合数据的特点,采用两次裁剪的方法,对Apriori算法进行了改进,并将改进后的Apriori算法运用于余杭区新农合管理系统中进行新农合居民疾病类型关联分析。 3.介绍了离群数据挖掘的基本概念,采用基于规则的方法实现了农民医疗费用的异常点检测。 4.设计并实现了一个集数据提取、数据预处理、关联规则挖掘和结果显示于一体的新农合管理系统。 5.最后,对全文进行总结,并对进一步的研究提出一些展望。