关键词:
大数据
铁路工程
施工日志
数据仓库
关联分析
摘要:
随着铁路工程电子施工日志在各个铁路线路的推广,施工现场数据正在以前所未有的速度增长,这些数据包含了轨道、路基、桥涵、隧道等多个专业,收集了技术员、质量员、安全员现场三大员的日常工作,覆盖了现场填报、工作流、基本统计在内的多个业务场景,具备多样性特征。在大数据时代,如此庞大、融合多个专业的数据对现场施工、项目管理来说就是一座金矿,能够为管理和施工提供有效、关键的信息,具有很高的分析价值,但目前并没有很好的利用这些数据,使之转化成企业效率增长的动力。另一方面,随着数据的增加,业务系统负担越来越重,在其上开展统计分析使得系统性能下降,急需引入大数据技术来消除海量数据带来的性能影响。本文将从介绍铁路工程电子施工日志系统展开,详细分析当前系统的数据结构和特点,将数据分为结构化和非结构化两大类型进行论述,提出施工日志应用大数据的问题域。然后对施工日志应用大数据进行总体规划和设计,以软件工程开发方法为工具,对问题域进行分析和研究,逐步化解,将问题域转换为问题解决域,形成存储系统和分析系统两大业务领域。最后,分别对存储系统和分析系统进行工程化,仍然使用传统的软件开发方法,根据本人工作期间接触到的客户需求,整理成具体的分析应用场景,从需求分析、系统设计逐步构建分析应用,利用需求分析方法、Hadoop及其工具集合、数据挖掘算法,覆盖抽取、清洗、加载、查询、分析全数据生命周期,对分析应用进行最终的搭建和实现。通过存储系统、分析系统的相互支撑,对特定的数据进行了分析,使信息更容易被建筑企业理解,更容易转换为生产力,提高相关企业对于数据的洞察力。大数据的应用本身是一个循环的过程,通过应用大数据获得分析模型,提高现场施工、管理水平,良好的管理水平能够提升数据本身的质量,再通过高质量的数据,更进一步完善模型,完成一个相互促进、良好流程的闭环,最终实现施工日志数据的价值转换。通过本文对施工日志数据的应用,为这个循环迈出第一步,通过实践达到客户的预期。