统计监控建模数据预处理离群点检测算法
来源期刊:控制工程2013年第4期
论文作者:肖应旺 杨军 张承忠 姚美银 杜瑛
文章页码:756 - 761
关键词:鲁棒离群点检测算法;多元统计监控建模;数据预处理;β-甘露聚糖酶发酵间歇过程;
摘 要:针对基于多向主元分析(Multi-way Principal Component Analysis,MPCA)(包括主元分析(Principal Component Analysis,PCA)的统计监控模型易受建模数据中离群点影响的不足,通过对各种不同尺度的中心化和标准化方法及鲁棒离群点检测算法的对比研究,提出了一种基于改进尺度的中心最短距离/椭球多变量整理(Closest Distance to Center/ellipsoidal Multivariate Trimming,CDC/MVT)的建模数据离群点去除算法。该算法首先利用改进尺度得到离线建模正常数据的均值和标准差,并对数据进行中心化和标准化处理;然后利用CDC算法找出建模历史数据中最一致的一半正常点;最后用这最一致的一半正常点初始化MVT的马氏距离的均值和协方差,并通过迭代计算得到其他的正常点。将该算法应用于β-甘露聚糖酶发酵间歇过程离群点的去除,与其他鲁棒离群点检测算法相比,应用结果表明该算法能有效地去除建模数据中的离群点。
肖应旺,杨军,张承忠,姚美银,杜瑛
华南师范大学南海校区计算机工程系
摘 要:针对基于多向主元分析(Multi-way Principal Component Analysis,MPCA)(包括主元分析(Principal Component Analysis,PCA)的统计监控模型易受建模数据中离群点影响的不足,通过对各种不同尺度的中心化和标准化方法及鲁棒离群点检测算法的对比研究,提出了一种基于改进尺度的中心最短距离/椭球多变量整理(Closest Distance to Center/ellipsoidal Multivariate Trimming,CDC/MVT)的建模数据离群点去除算法。该算法首先利用改进尺度得到离线建模正常数据的均值和标准差,并对数据进行中心化和标准化处理;然后利用CDC算法找出建模历史数据中最一致的一半正常点;最后用这最一致的一半正常点初始化MVT的马氏距离的均值和协方差,并通过迭代计算得到其他的正常点。将该算法应用于β-甘露聚糖酶发酵间歇过程离群点的去除,与其他鲁棒离群点检测算法相比,应用结果表明该算法能有效地去除建模数据中的离群点。
关键词:鲁棒离群点检测算法;多元统计监控建模;数据预处理;β-甘露聚糖酶发酵间歇过程;