关键词:
高考志愿填报
商务智能
数据仓库
OLAP
数据挖掘
摘要:
高考作为我们教育体系中的重要环节,有着承上启下的作用,更承担着为高等教育选拔人才的重任。志愿填报作为高考过程中的重要环节,关系着每一位考生的未来,也关系整个社会的人才流动。长期以来,一方面,高考招生录取过程中累积的大量数据没有得到充分的分析与利用,另一方面,考生在填报志愿的过程中存在着了解信息过少,获取信息渠道不多等问题,填报志愿时或多或少带有盲目性或赌博心理。因此,迫切需要引入一种科学合理的高考数据分析方法,并在此基础上为广大考生填报志愿提供科学合理的指导与帮助。 某省从2000年开始进行网上高考招生录取,积累了大量的招生数据,其中蕴含大量可供考试主管部门、院校以及考生借鉴的有用信息。但是由于数据分析手段及工具的缺乏,以及数据本身的复杂性,这些信息多年来难以被有效利用,难以为招生主管部门提供决策支持,也难以为指导考生填报志愿提供数据支撑。因此,将商务智能技术引入高考数据分析,研究数据预处理技术、数据仓库技术、联机分析处理(On-Line Analytical Processing, OLAP)技术与数据挖掘技术在高考数据分析中的应用,并基于分析结果建立高考志愿填报指导系统,是本文的主要研究内容。围绕高考数据分析的问题,我们团队借助数据挖掘这一有效的海量数据分析技术,研究某省近十年来的高考招生数据,并已依据该省近十年的高考招生数据建立了数据仓库。本文在已经工作的基础之上,进行进一步的工作与研究,最终实现了一个对于考生填报志愿比较有指导意义的在高考志愿填报在线咨询系统。 本文的工作主要包括以下几个方面:(1)历史招生数据的装载以及多维数据集的建立 在充分学习与理解已有的数据仓库的基础之上,本文通过ETL(Extract-Transform-Load)工具,载入了09年的高考招生数据。然后基于此数据仓库建立了一个统一的多维数据集,为下一步的OLAP分析及数据挖掘打下了基础。 (2)OLAP分析的实现与展示 本文在多维数据集的基础上,利用OLAP技术分析考生志愿填报、院校计划、考生录取等多个主题的数据,得到一些有用的信息,并且利用SSRS(SQL Server Reporting Services)技术与Web技术,将OLAP分析结果通过报表方式展示。 (3)数据挖掘的研究与实现 本文利用SSAS (SQL Server Analysis Services)平台,研究将数据挖掘技术应用于高考招生数据分析,关注于志愿填报、考生录取等主题,重点研究了决策树、关联规则等算法的应用。并且对挖掘模型进行了评估,并设计了数据挖掘的前端展示方案。 (4)高考志愿填报在线咨询系统的研究与实现 本文利用上述工作的成果,采用SSH(Struts, Spring, Hibernate)架构,设计与实现了一个基于商务智能技术的高考志愿填报在线咨询系统。该系统与数据挖掘系统进行了集成,利用数据挖掘的结果为考生填报志愿作指导,具有较好的科学性与实用性,为后续工作打下了良好基础。