1。2。2发展及研究现状[1]
早在20世纪70年代,图像检索就已经出现了,但当时互联网并未充分发展,而且图片数据总量较少,所以主要是以人为参与的文本注释方式进行图像的检索。20世纪90年代,互联网迅速发展起来,1995年3月第一届元数据研讨会在都柏林召开,并提出了第一个元数据集——都柏林核心元数据集(Dublin Core Element Set),它为互联网统一形式化数据提供了可能,最为出名的则是1998年10月提出的MPEG-7 [13]。互联网的发展带来的是数据的增长,人们的信息检索方式因此发生了改变,简单的文本搜索已经无法满足需求,此后各种图像检索方法陆续发展起来。谈到图像检索技术的发展,不得不提到的是Google [14],早在2006年,Google为改变日渐混乱的互联网数据环境发声,它做了一款小游戏叫:Google Image Labeler(图片贴标机),游戏规则很简单:参加游戏有两人,系统随机给出一张贴图,由两位参加者用词汇描述它,两人给出的一致则得分(这个思路和我在一部影视作品《东之伊甸》里看到的比较类似,一张图片由大家进行描述,实现信息共享)。Google试图通过这个游戏来搜集互联网图片的信息并进行分类,然而事与愿违,因为出现了水军刷广告关键词,造成信息有效性下降,所以该项目也夭折了。后来Google 又推出了手机上的图像识别工具Goggles,在大类划分的基础上实现每个大类下更精确的检索,然而不知为何现在好像已经被放弃了,据说是因为识别率不高的缘故。
图1。2Google Goggles软件界面
互联网遍布全球各行各业,信息化、数字化的趋势不可避免,因此图像检索技术的应用方向也是非常广泛的。图像检索最为常见的应用包括电子商务领域的商品搜索、数字图书馆的书本搜索、监控安防领域的实时追踪和信息采集还有纯粹的图像搜索引擎等等[6]。论文网
1。2。3多特征融合技术在图像检索中的发展[12][15]
从基于内容的图像检索技术诞生发展到如今,基于颜色、纹理、形状、空间层次关系等单一视觉特征算法的研究工作已经取得了一定的成果。但是,基于这些基本视觉特征的算法主要考虑的是图像的一部分属性,这些属性有其自身的特点和适用范围。在图像检索的实际过程中,仅仅依赖单一的基本视觉特征进行检索,效果往往不够理想,难以满足需求。图像检索研究人员针对这一实际问题,提出了新的解决方法,那就是以综合特征作为图像检索的基础,获得图像的综合特征并将其作为图像相似性的评估依据,即为多特征融合技术。
多特征融合毫无疑问是完成多种图像特征的融合,除了在特征融合的特征源上做选择之外,考虑如何融合也是一大难点,目前常见的有向量串联、线性融合等思路,再配合归一化、降维算法(如PCA)、聚类(如K-means)等方法,最后都可以得到不错的检索性能。
2相关算法和概念
2。1PCA 算法
2。1。1简介
PCA(Principal Component Analysis)主成分分析作为一种常用的数据分析方法,现在常用于对数据信息进行特征抽取,在图像特征向量的处理中,它的主要功能是对高维的特征向量进行维度约减,同时提高运算性能,减少不必要的开销。
PCA的核心思想是利用较少数据的特征对样本进行描述以达到降低特征空间维数的目的,根据样本点在多维空间的位置分布,以及样本点在空间中变化最大方向,即方差最大方向,作为差别矢量来实现数据的特征提取,其数学原理详见文献[16]。
2。1。2PCA算法降维步骤
设有个维数据向量,目标是得到个维数据向量: