关键词:
环境工程学
VOCs
半监督
异常检测
时域卷积网络
时间序列数据
摘要:
为了提升挥发性有机物(Volatile Organic Compounds,VOCs)数据异常检测精度,提出一种基于时域卷积网络的深度自编码器(TCN-DAE)异常检测的半监督方法,以对VOCs等空气污染物质量浓度异常值进行精准的检测。首先,使用时域卷积网络(Temporal Convolutional Network,TCN)作为深度自编码器(Deep Auto-encoder,DAE)的隐藏层,利用深层网络结构对高维、多源的时间序列数据进行高效地特征提取和数据重构。然后,通过对比重构误差与核密度估计法确定的阈值进行异常检测,其中重构误差大于此阈值则视为异常。最后,选取西安市城六区的VOCs、空气质量和气象等时间序列数据进行试验。结果显示:基于时域卷积网络的深度自编码器模型对多源、高维的时间序列具有较强的异常检测能力,在准确率、F1分数、受试者工作特征曲线下面积(Area Under Curve,AUC)等异常检测性能指标上均优于双向长短期记忆网络(Bidirectional Long Short-term Memory,Bi-LSTM)、长短期记忆网络(Long Short-term Memory,LSTM)、自编码器(Auto-Encoder,AE)和时域卷积网络(Temporal Convolutional Network,TCN)模型,表明了本文模型的可行性。