关键词:
数据挖掘
关联规则
数据仓库
信息管理系统
摘要:
我国实施“以信息化带动工业化”发展战略以来,企业信息化伴随着经济建设得到了快速发展,数据库管理系统已在工业生产领域中得到广泛的应用,使得企业积累的生产信息数据越来越多。企业希望能在更高层次上对这些生产信息数据进行分析,以便充分的利用这些数据,为辅助企业如何提高管理水平、降低生产成本等提供决策依据。 本文首先介绍了数据挖掘技术的概念、特点、分类和常用技术,概述了数据挖掘技术产生的时代背景、以及在各个领域的应用情况,并说明了国内外数据挖掘技术的研究现状和发展方向。 其次,分析了关联规则挖掘的步骤、经典算法和改进算法的详细内容,根据关联规则算法中如果项数越多,算法时间复杂度越高,效率越低的特点,结合冲压厂能明确关联规则发掘的结论(这里指反应产品质量状况的属性)的情况,提出了适合于冲压厂实际情况的关联规则算法的优化,在总体上减少了实际参与计算的项数,从而减少了算法的时间和空间消耗,提高系统挖掘效率;针对冲压厂生产信息管理系统中由于数据源分散,造成数据冗余、不规范、错误和不一致的的问题,建立了面向生产数据分析主题的数据仓库,为数据挖掘提供了高质量的数据,简化了数据挖掘的步骤,减少了挖掘前数据预处理的时间。 最后,在冲压厂生产信息管理系统基础上,结合SQL SERVER2005数据库,利用delphi7开发出一套基于C/S架构的生产数据分析系统软件。该分析软件画面直观易懂、操作简便,具有较好的可扩展性,为管理人员提高产品质量、降低产品次废品率提供了决策依据。 本文主要特点是:结合冲压厂实际情况,建立了面向生产数据分析主题的数据仓库,实现了关联规则算法的优化;并把数据仓库和数据挖掘技术相结合,设计了一套适合冲压生产信息数据分析的数据挖掘系统,达到了为冲压厂提高产品质量提供对策的目的。该系统的成功开发和应用为数据挖掘技术应用于汽车零部件生产数据的分析,解决类似冲压厂这种多品种、多工序、混线生产以及数据量大等造成数据分析难的问题做了一次有益的尝试。