在基于数据驱动的工业过程性能监控算法中,研究和应用最多的方法应属基于统计的方法了。统计过程控制(statistical process control,SPC)的思想最早在上个世纪二十年代便已被提出,以美国Walter Shewart博士发明了控制图作为标志,他在建立SPC的过程中作出了重要的贡献。在一大批学者以及工程技术人员的共同努力下,SPC的发展得到了推进,SPC在离散制造工业获得了广泛的成功应用。在上世纪五十年代,SPC的思想又得到进一步的发展,但是当SPC在过程工业中成为一种质量控制的标准工具时是在七十年代。尽管SPC是一门较成熟的工业技术,但是长期以来,工业界的企业技术人员们和学术界的学者们并没有停止对它的研究。实际上,这项技术在近十几年来又取得了很多新的进展,除了早期Shewhart提出的X控制图 (测量变量对时间作图),还有MA (Moving Average)控制图:测量变量的滑动平均对时间作图; EWMA(Exponentially Weighted Moving Average)控制图:变量的指数加权滑动平均值对时间作图: CUSUM (Cumulative Sum)控制图:测量值与目标值偏差的累加和对时间作图。
多变量统计过程控制(Multivariate Statistical Process Control, MSPC) 是基于假设所观察到的数据必须是高斯概率分布的,由大量方法组成。与统计过程控制不同的是,它主要使用包括各种投影降维方法(Davis等)。投影算法的基本思想是将由大量测量变量所张成的高维空间投影到维数更少的模型空间。模型空间通常由主元变量或潜在变量 (latent variables)所张成,其中主元变量是由原始测量变量经过线性组合得到的。使用投影方法的目标就是设法找到这些主元变量,然后用更少的维数来描述整个过程的主要特征,最大限度地使原变量的有用信息直观呈现。在多变量统计过程控制中,最基本的方法就是主元分析 (Principal component analysis, PCA)。随后,大量学者对PCA作了比较深入的研究,使其理论逐渐完善,其中主要包括Fisher和MacKenzie、 Hotelling等人的工作。另一个重要的多变量统计方法是偏最小二乘法(Partial least square, PLS),它是一种与PCA有密切联系的多元回归方法。应该指出的是,多元统计方法的发展历史与计量经济学、化学计量学等领域的发展是密切相关的。在二十世纪七十年代,化学统计学被提出,在八十年代,化学统计学受到广泛的注意,各种新的化学计量学算法的基础及应用研究取得了长足的进展,成为化学与分析化学发展的重要前沿领域,并开始应用在过程监控领域。在九十年代,随着统计方法在应用过程中出现的各种实际问题,不少改进和扩展的统计方法被提出。文献综述
1.3 研究内容
本文所采用的核独立元分析方法(Kernel Independent component analysis)是一种基于独立元分析的改进的独立元分析方法, 其中核指核函数函数,是用来计算和优化基于规范相关性的比较函数的, 该方法将选择的非线性的比较函数扩展到一个再生的核希尔伯特空间, 而不是再是使用单一固定的非线性函数。这使得KICA能更有效地从含有多种分布的复杂源数据变量中进行特征提取,恢复出主变量。随后在特征空间利用ICA的方法提取非线性的独立元,以此来为现代使用众多仪表测量数据的实际工业生产过程的故障诊断提供了一种新的思路。本文主要使用Tennessee Eastman过程数据进行模拟仿真,再对比ICA方法下的监控结果,以此来验证核独立元分析方法在由工业流程中测得多数据变量为基础建立的检测模型中的有效性。
1.4 全文安排
本文共分为五章:
第一章介绍了基于数据驱动的性能监控算法的背景与研究现状,简单介绍了使用多变量统计过程控制的方法,最后提出本文的研究内容与文章安排。