(1)构造原始数据矩阵行列矩阵(零均值化);
(2)求出协方差矩阵;
(3)求出协方差矩阵的特征值与特征向量;
(4)按特征值的大小顺序排列对应特征向量组成矩阵,取前行组成矩阵;
(5) 即为所求维特征向量集。
2。2K-means聚类算法
2。2。1简介
所谓聚类,其实就是把相似性高的一类东西放在一起,如果放在一个数据集中来看,聚类就是把数据集分割成各不相似的几大类或者说簇,从而更精确地分析一个类的数据相似性和类之间的数据差异性。
聚类技术主要应用于机器学习、统计学、数据挖掘等领域,近年来机器学习和互联网大数据的发展促进了聚类技术的多元化发展,不同的聚类算法对应于不同的领域各有用处,主要有K-means聚类算法、凝聚型层次聚类算法、神经网络聚类算法之SOM以及模糊聚类算法的FCM [20]。
2。2。2K-means聚类算法过程[20]
假设数据库内包含个对象,聚类簇的数据规定为,收敛阈值为:
(1)任选个对象作为初始化簇中心点;文献综述
(2)将个对象点按照和中心点距离最近的原则分配到各个簇;
(3)重新计算各个簇内部对象集的中心点,并规定为新的簇中心点;
(4)计算新旧簇中心点间的距离,并和值对比,大于则重复(2)(3)和本步骤,否则结束聚类算法,此时的簇中心点和对应的簇便是原数据集的最优分割。
步骤(1)中初始簇中心点集的建立还可以采用最大距离点集的方式,不过计算开销较大,如果是分类较小的数据集,对结果的优化也不明显,详见文献[18,19]。
2。3本系统所使用的图像特征表示方法
2。3。1图像纹理特征
(1)LBP(Local Binary Pattern,局部二值模式)[27]
LBP方法由 Timo Ahonen等人在 1994年提出,其算子是一种用来描述图像局部纹理特征的算子,用于辅助性的度量图像的局部对比度。如图2。1所示,得到最基本的LBP算子的原理是将原来以一个像素点为中心的 33方格内的周围8 个像素点的值与中心像素点进行对比得到的 8 位 0、1 二进制序列数作为得到的LBP图像中心像素点的值,这样处理所有的像素便可以得到0~255的LBP 灰度图像。将这些像素点的灰度值进行直方图统计,在经过映射矩阵的变换过后,便可以得到初始的59维的特征向量,LBP 也有很多变体比如等价模式 LBP 算子和旋转不变模式 LBP 算子。
图2。1LBP算子原理图
(2)DSIFT(Dense Scaler-Invariant Feature Transform,密集型尺度不变特征转换)[21][28]
SIFT算法于 1999 年由 David Lowe 首先发表于计算机视觉国际会议(ICCV),2004 年再次经 David Lowe 整理完善后发表于 International journal of computer vision(IJCV),SIFT 通过求一幅图中的特征点(interest points, corner points)及其有关 scale和 orientation 的描述子得到特征并进行图像特征点匹配,其特征提取步骤主要包括:构建高斯金字塔、构建差分高斯金字塔,特征点提取、计算特征点梯度幅值和主方向、得到特征描述子,再用于后期的处理,SIFT 特征不仅具有尺度不变性,即使改变了旋转角度、图像亮度或者拍摄视角,仍然能够得到好的检测效果。DSIFT作为SIFT的一种变体,改变了原始的金字塔特征提取方式,如图2。2所示,DSIFT将特征点分类提取变为密集式提取,每隔一定的块间距取一个特征点,使特征点分布均匀且数目可控,并采用与SIFT相同的方式处理一个特征点对应的子区域。DSIFT在图像分类方面有广泛的应用。来:自[优E尔L论W文W网www.youerw.com +QQ752018766-