关键词:
模型驱动架构
多维数据模型
数据仓库
ETL
多维数据分析
摘要:
随着信息化技术的发展和管理信息系统的普及,各行业的业务处理数据库中积累了大量而丰富的数据。人们希望从这些海量的业务数据中探寻规律、发现知识,以辅助管理决策。然而普通的业务处理系统往往只注重于对业务的实时处理,数据分析能力有限,数据展现形式也比较单一,而且升级改造成本较大,很难满足人们对数据进行多角度深入分析的需求。 因此,如何以较低的成本,来快速的开发出能够支持多维数据分析的系统就成为一项重要的研究课题。针对普通业务系统在数据分析方面存在的问题和不足,本文提出了一种基于MDA的多维数据分析平台,为多维数据分析系统的构建提供了高效的解决方案。本文充分利用了MDA思想,对数据仓库、数据集成、数据统计分析和数据可视化展示等方面进行研究,并基于J2EE技术设计实现了采用三层架构模式的平台框架。通过该平台框架,开发人员可以快速的完成数据分析和数据可视化业务的功能开发。 在平台的实现过程中,本文通过分析商业智能的实现过程,抽取出了多维数据分析过程中的各类模型,为以模型驱动开发指明了方向。本文采用XML作为模型定义的语言,并参照CWM的规范对元模型进行设计管理。 通过对数据仓库中事实表和维度表的关系进行分析,本文明确了数据仓库的构建方式,并基于星型模式对多维数据进行建模,形成模型的XML描述标准,定义了与具体技术平台无关的多维数据模型。以多维数据模型为驱动,设计模型解析引擎,输出针对特定平台的模型实例,便可构建数据仓库,解决了普通业务处理系统中的数据格式不规范的问题。本文还分析了数据仓库的数据集成过程,对ETL过程进行抽象建模,以XML为载体定义了ETL的平台无关模型,通过模型的转换,获得相应的SQL(?)(?)Java代码实现对数据的抽取、转换和加载,将分散在不同业务数据库中的数据集中到数据仓库中。 为了实现多角度的分析数据,本文对OLAP的方法和过程进行研究,定义了多维数据分析的OLAP模型,该模型可以转换为对数据库表的连接查询SQL,来实现对多维数据的查询分析。最后,本文采用Flex的相关技术实现信息的可视化展示,使用户可以直观的观察分析数据。 本文将MDA的思想与多维数据分析系统的开发紧密地结合起来,进行了探索性的研究,为多维数据分析系统的开发寻找了一个有效的解决方案。该方案降低了开发的成本,提高了开发效率,具有一定的通用性和重用性。这使得本文的课题研究具有一定的理论意义和应用价值。