而事实上,影响环境质量情况的因素不胜枚举,而且各影响因素之间的相互影响作用使得对环境质量的评价体系建立工作变得十分抽象与复杂。以上各种方法大多都没有考虑到指标过多、指标之间非线性关联对研究结果准确性的影响, 并且无论是使用层次分析法还是熵权法,在构造判断矩阵时都没有考虑各指标权重来源的可信度,使得评价结果主观性太强。怎样建立合理的、具有普遍适用性且指标信息容易取得的指标体系, 并用合理的方法进行评价, 是我们对环境质量做出评价至关重要的一环。针对上述问题,万星火(2014)在《基于核主成分分析的环境质量综合评价模型》一文中,运用了核主成分分析(KPCA)的方法,建立了环境质量综合评价模型,通过对2011年度全国各地(除台湾外)的环境状况数据进行实证分析,对各地的环境质量情况做出了研究与评价。在运用这种方法的过程中, 不需要人为的赋予各指标权重, 使得综合评价结果更客观,能够较好的反映出各地区环境质量的实际状况, 也证明了该方法对环境质量综合评价的有效性和科学性。
本文计划以浙江省统计年鉴中,2000年度到2013年度的相关数据为依据,基于统计学角度对环境质量情况进行进一步的探讨源`自·优尔~文;论:文'网[www.youerw.com。我们计划通过主成分分析的方法建立浙江省环境质量情况的评价模型,进而对浙江省环境质量情况的影响因素做出更客观,更准确的分析和解释,在此基础上提出我们的一些建议。我们讨论的对象属于城市这样的中等尺度,可以作为对现有的环境质量情况讨论范畴的一个补充;而我们的方法基于定量的模型分析,也能为现有的结果提供有力的佐证。
3.主成分分析的基本思想及特点
3.1 主成分分析的基本思想
主成分分析也称主分量分析,于1933年由霍特林最先提出。主成分分析是利用降维的思想,在损失很少信息的前提下,把多个指标转化为几个综合指标的多元统计方法。在研究某一问题时,人们往往要考虑与其有关的多个指标。与此同时,由于各个指标都是对同一或者相关事物的描述,往往造成信息的大量重叠,几乎是不可避免的。而主成分分析正是研究怎样通过减少原来变量的几个线性组合来解释原本变量的绝大多数信息的方法。这种方法在保留了较多的原始变量的前提下,达到了降维的目的,从而达到了化复杂的问题为简单的问题的目的,抓住了问题的主要矛盾。因此,我们在求解主成分的时候,总可以从原始变量的协方差矩阵或者相关矩阵的结构分析入手。我们利用样本数据求解主成分的过程,实际上就是将其转化为求相关矩阵或协方差阵的特征值和特征向量的过程。
通过主成分分析的方法,我们可以在各种错综复杂的因素之间找出一些主要成分,进而有效利用大量数据进行定量分析,揭示各个变量之间的内在联系,得到事物的特征以及其发展规律,获取更深一层次的启发,把研究工作从表面引向深入。