关键词:
政府网上采购
网上交易资金
协议商品
数据仓库
数据挖掘
摘要:
在大数据时代,随着信息技术的发展和管理模式的创新,以互联网为核心技术的政府采购电子化模式颠覆了传统的政府采购模式,将采购管理部门、采购人、供应商、电子商务平台等多个主体联系在一起,实现了政府采购的信息共享。政府采购网上交易模式的变革,促使政府采购规模的逐年扩张,沉积了海量有价值却未被利用的政府采购数据。数据仓库和数据挖掘技术的出现给这些政府网上采购数据带来新机遇,数据仓库技术通过抽取政府采购业务处理系统的历史数据,并进行数据预处理后集成政府采购数据仓库,解决了各采购区域采购系统数据结构不一致等政府采购管理问题,为采购数据挖掘与分析提供了有效数据支撑。数据挖掘技术通过挖掘分析方法对政府采购数据仓库的交易数据进行多维分析,有助于加强采购人、供应商和财政部门的数据交流,为政府网上采购监管部门的监管工作提供了数据参考。本研究首先介绍了政府采购数据仓库工具和数据挖掘工具、相关研究技术和研究方法;然后根据政府采购网上交易模式,搭建了政府采购数据仓库;再根据政府网上采购业务流程和应用需求设计了政府采购数据仓库的从属数据集市,选择挖掘方法,建立了相关数据挖掘模型并对政府采购网上交易资金大数据进行了挖掘分析。本文主要研究成果有以下五个方面:第一,通过对政府采购网上交易业务处理系统的数据进行抽取、转换和装载处理,根据政府采购数据仓库的概念模型、逻辑模型和物理模型的设计,建立了业务资金一体化的政府网上采购数据仓库,为网上交易资金数据挖掘奠定良好基础。第二,根据政府网上采购流程和采购需求,从政府采购的申请、计划、执行和合同四个阶段整体分析了相关数据挖掘方法和分析维度,但由于数据的有限性和保密性,本文仅对政府采购执行阶段,针对政府采购文本数据、采购行为和交易资金规模变化三个方面进行具体挖掘分析阐述。第三,通过文本挖掘对重庆市政府网上采购情况进行文本信息特征提取,从商品目录、采购区域、采购单位、价格来源、供应商等维度进行词云分析,形成可理解的采购知识,为判断全年政府网上采购交易规模情况提供参考。第四,通过关联规则挖掘对政府网上采购交易订单号和商品目录进行分析,发现协议商品之间的相关性,为采购人快速找到合理价格的协议商品提供数据参考,力图提高采购效率,节约采购资金。第五,通过时间序列算法对政府网上采购协议商品数码相机的逐期成交资金数据进行分析,预测未来一段时间政府采购数码相机的成交金额。以时间为维度,从采购单位、采购区域等多角度对采购的数码相机进行分析,为采购人在采购协议商品时提供价格参考,为下一阶段政府网上采购资金的预算管理提供参考。本文为了满足政府采购数据仓库和网上交易资金数据挖掘需求,采用MySQL作为数据仓库管理工具,R语言作为数据挖掘分析工具。重庆市政府网上采购业务系统是MySQL数据库管理系统;R语言拥有强大的程序包和可视化功能,操作简单,可理解性强,和其他平台或工具并行使用,就能充分发挥其优势。基于此,本文将MySQL和R结合使用,通过RODBC数据包连接集成的数据仓库,获取经过预处理后的政府采购历史数据并进行数据挖掘及相关分析。