第二章介绍了主流的较为成熟的基于数据驱动的性能监控算法的原理,其理论基础与基本实现基础,是开展课题工作的知识铺垫,也是全文的基础。
第三章针对独立元分析方法的不足 ,针对在对工业非线性故障诊断的漏判率与误判率高的缺点,提出改进的核独立元算法,给出其算法以及实现性能监控的原理。
第四章介绍了TE过程,使用上一章中提出的算法处理TE过程的数据,分析对比了使用独立元分析算法得到的结果,对核独立元算法的性能进行评判。
第五章是对本文工作的总结以及对以后工作的展望。
2 基于数据驱动的性能监控与故障诊断算法
2.1 主元分析
PCA的应用都是事先假定测量数据是相互独立且服从同一高斯分布的。但对于实际生产过程而言,这个假定是需要进行统计检验的。事实上,即使系统输入是服从高斯分布的,但对于某些具有强烈非线性,大纯滞后的工业生产过程,输出也不再服从高斯分布,且在闭环控制的条件下,测量变量不再相互独立,而存在序列相关性。因此,探讨如何基于生产过程的历史记录数据,确定相应的数据分布规律,从而进行系统性能监控是非常必要的。
传统主元分析考虑一零均值服从高斯分布的向量x∈R m,满足
(2.1)
式中,N(0,∑)表示高斯分布密度函数,∑为协方差矩阵。令X∈Rn*m ,为正常工况下的 样本数据构成的矩阵,其中n为采样点数,m为测量变量数。对于过程监控而言,其目的就是根据数据矩阵X,判断新采集到的样本数据x是否发生了异常。一般而言,存在着三种类型的异常:(1)变量的均值发生了变化:(2)变量的方差发生了变化:(3)变量之间的相互关系发生了变化。
传统的单变量统计过程控制通过假定x中的所有元素都相互独立,即矩阵∑中非对角线元素均为零,利用Schewhart控制图可以检测出第一和第二种异常情况。对于第三种异常情况,主元分析被提出用于检测变量之间的相互关系是否发生了变化。它通过对 X的协方差矩阵 进行奇异值分解而得到。即来!自~优尔论-文|网www.youerw.com
(2.2)
式中, ,且满足 ,为协方差阵R的特征值矩阵。矩阵P∈Rm*m为协方差阵R的特征向量构成的矩阵,且满足PTP=I。当各变量 之间存在相关性时 (即变量之间存在线性等式关系),矩阵R为奇异阵,即 中包含若干个零特征值,且零特征值的个数等于等式个数。值得注意的是,由于过程总不可避免地存在噪声,这些等式关系并不严格成立,因此,其所对应的特征值也并不为零,而是一个与噪声大小水平有关的比较小的数。若将矩阵P根据其对 应特征值的大小分成两部分,前k个特征向量对应于主元变量,后m-k个特征方向对应于噪声,则通过将x投影到前k个特征方向上,可以去除了变量之间的相关性,由于一般k << m,从而达到降维目的。理想的k值应使m-k的值等于系统存在的等式关系的个数,但事先并不能确切知道等式关系的个数,为了确定k值,有多种确k值的方法,常见的有方差累计和百分比(cwnulative percent variance)、交叉检验 (cross-validation) 等。本文采用第一种方法确定k值。据此,数据向量x可以分解为
(2.3)
式中, 和 分别为主元空间和残差空间的投影算子矩阵,且 , 为矩阵P前k个特征向量构成的矩阵,它的各列向量张成了主元子空间: 为矩阵P后m-k个特征向量构成的矩阵,它的各列向量张成了残差子空间。