关键词:
化学需氧量
紫外-可见吸收光谱
内核主成分分析
极限学习机
摘要:
化学需氧量(COD)是水质检测重要指标之一,反映水体有机物含量。传统的COD化学检测方法存在操作繁琐,等待时间长,二次污染等缺点。紫外-可见吸收光谱法是目前水体化学需氧量检测中应用最为广泛的方法之一,具有检测快速、无污染等特点。为了满足地表水化学需氧量快速、实时、在线监测等要求,采用紫外-可见吸收光谱进行测量,提出了内核主成分分析(KPCA)结合粒子群优化极限学习机(PSO-ELM)预测模型,满足当前对地表水化学需氧量快速、实时监测的要求。对光谱进行Savitzky-Golay(SG)滤波以降低随机噪声的影响;用积分光谱代替原光谱,以降低信号波动带来的影响;再将得到的光谱信息归一化,消除不同光谱数据量纲的影响。将预处理后的数据利用KPCA算法将全光谱数据压缩为5个特征,有效解决光谱信息冗余的问题;采用PSO算法对ELM的权重和偏置进行优化极大提高了模型的精度。对217个河流、长江及支流、湖库等地表水样本按照7∶3随机划分成训练集和测试集,并进行建模测试,其中训练集拟合优度(R2)为0.930 2、均方根误差(RMSE)为0.363 0 mg·L^(-1)、测试集拟合优度R2为0.931 9、均方根误差(RMSE)为0.400 7 mg·L^(-1)。为了验证提出的基于KPCA全光谱数据压缩方法对预测模型的提升效果,分别对比了主成分分析(PCA)、连续投影算法(SPA)、套索回归(LASSO)等特征处理算法。PCA-PSO-ELM模型的RMSE为0.715 1 mg·L^(-1)、 SPA-PSO-ELM模型的RMSE为0.473 7 mg·L^(-1)、 LASSO-PSO-ELM模型的RMSE为0.412 6 mg·L^(-1), KPCA-PSO-ELM模型较上述三种模型,RMSE分别降低了78.46%、 18.22%、 2.97%,结果表明KPCA是一种高效的光谱降维算法,能够有效消除光谱冗余信息,提升模型预测精度。基于KPCA-PSO-ELM预测模型结合紫外-可见吸收光谱可以实现对地表水COD快速、实时检测,为在线COD检测场景提供方法支撑。