关键词:
随机矩阵理论
异常数据检测
特征值
特征向量
异常用户识别
摘要:
随着智能电网的不断发展,电力公司储存的数据不断增多,而这些数据中隐藏用电客户的重要信息,对异常数据进行识别和检测变得十分重要,对电力安全运行起着重要的作用。但由于数据趋于高维化,传统的方法逐渐不能满足需求。随机矩阵理论作为一种大数据分析方法,可以很好的从数据中提取重要信息。本文将从异常数据检测和异常用户识别两个方面进行分析研究,论文的主要工作包括以下几个方面:
(1)对随机矩阵理论的内容进行了描述,构建了基于数据的随机矩阵建模。针对用户用电异常检测的问题,提出了一种基于随机矩阵理论的综合特征检测算法。首先通过时间排列、叠加高斯白噪声等方法构造数据源矩阵,利用滑动窗口法得到各个时刻表示运行状态的窗口数据;其次,对窗口数据进行标准化、特征提取等操作,将最大、最小特征值和特征向量进行融合构造综合特征检测指标及阈值;最后,利用仿真对该算法进行研究验证。结果表明,该算法不依赖于任何模型,能够更全面、更充分的分析系统的运行状态,实现对异常数据的有效检测。
(2)对于异常检出时刻滞后的问题,提出了一种新的基于特征值的异常用电数据检测方法,该方法以协方差矩阵最大、最小特征值的差和比作为检测指标。通过运用大维随机矩阵中关于特征值渐近分布的理论,考虑到虚警概率和矩阵维度,运用Trace分布定理结合M-P定律计算出异常检测实际近似阈值,将特征值检测指标与预设阈值比较,实现对用电异常的检测。算例结果表明文中所提方法的有效性,减少了异常检测滞后的时刻。
(3)及时识别到异常用电客户是十分必要的,用户的用电数据反映了用户的用电特性,对数据进行深度挖掘和分析,能够很好的为异常检测提供保障。在本章中设计了一种新的基于DBSCAN聚类进行优化的异常用电客户识别检测方法,该方法以用户用电数据为基础,在对原始数据提取特征集并采用随机映射进行降维优化,提高了计算效率缩短了计算时间。对降维后的数据集应用DBSCAN进行聚类,从而实现对异常用电用户的识别,利用评价指标验证该方法的检测效果,算例结果表明该方法能够有效的识别异常用户。