哈希检索按照对象的类型分为单模态检索和多模态检索。随着多媒体的发展图像领域的哈希检索得到越来越多的关注,图像数据的巨幅增长和图像特征高文特点淘汰了属性索引结构,基于哈希的图像检索方法即HABIR将高文特征投影到较低文的汉明空间,使用汉明距离之间的比较作为图像相似度的衡量标准,从而在大规模图像中进行检索得到结果。HABIR对于图像检索的效率提高有了非常显著的帮助,适应了现代大规模图像检索的需求。哈希图像检索结合深度学习的方法,填补了哈希检索降低图像检索准确性的缺陷。有学者提出一种基于无监督哈希算法保存离散结构的大规模数据代码空间使检索精度得到了提升[2]。29837
哈希检索效率高并且占用存储空间小,所以被广泛应用。最初的图像哈希检索方法是Piotr Indyk等首先提出的局部敏感哈希即LSH[3,4]。此算法的思想是将数据随机映射,哈希法简单易行并且效率十分高,然而这不是数据驱动型的方法,所以精度并不能达到要求。而超比特局部敏感哈希即SBLSH[5]将角度当做衡量相似性的标准,分组正交化随机的投影向量,从而通过汉明距离的方差比较来证明比局部敏感哈希法优秀,然而这与局部敏感哈希法一样不是驱动算法。后来核化局部敏感哈希即KLSH[6]又对LSH进行了优化,考虑数据本身的结构,但又使得计算难度大幅提升。Weiss等人提出新的想法,在哈希法中又加入了关于图论的理论,得到了谱哈希算法即SH[7],此算法把哈希学习过程当做图像的分割过程,将哈希函数改进。他们所提出的所发是真正意义上的数据驱动型算法,在提升哈希检索精确度上具有一定的意义。普哈希算法的改进是锚点图哈希即AGH[8],构建二分图模型,构建近似近邻矩阵,增加减速效率和精确程度。大规模图像具有某些结构性,所以数据驱动型的哈希法对于图像检索的效率提高有很大的意义。对于大规模图像检索,有学者提出了一种新的方法,称为可扩展的图形哈希特征变换即SGH[9]。论文网
考虑到特征所占用的空间和检索所需要的计算量,大规模图像数据的最佳应对方案就是“近似最近邻”检索。在大规模图像检索中,如果使用中小规模的最近邻检索,会引起“文数灾难”,树形索引结构检索效率甚至会低于线性扫描[10],我们必须要有巨大的存储空间来存放图像提取的特征,并且大量的计算会耗费大量的时间,浪费人力物力。因此大规模图像检索可以通过对“近似最近邻”样本的检索来解决空间与时间浪费的问题。“近似最近邻”样本指的是,样本与查询样本之间的距离是“最近邻”样本与查询样本之间距离的c倍,c>1称为近似因子[11]。
图1 基于图像哈希的近似最近邻检索系统框图[11]
以上所提到的图像哈希检索方法属于基于图像内容的单模态哈希检索,而本文所使用的哈希检索方法属于多模态的哈希检索。
现有的多模态哈希方法可以分为两个主要类别:多源哈希(MSH)和跨模态哈希(CMH)。
MSH也称为多特征哈希或复合哈希,其旨在通过利用辅助视图而不是单模哈希来学习更好的代码。 MSH假定在执行搜索时应当为查询点提供所有视图,这对于许多多媒体应用通常是不可行的。
因为在跨模态哈希中对于一个查询点只需要一个视图,所以相比于多源哈希跨模态哈希更受欢迎。例如在Flickr图像数据集中,图像检索文本、文本检索图像、图像检索图像这三个任务都可以通过跨模态哈希的检索方法完成。
- 上一篇:图像特征提取技术研究现状
- 下一篇:互联网+国内外研究现状
-
-
-
-
-
-
-
浙江省嘉兴市典型蔬菜基...
油画创作《舞台》色彩浅析
松节油香精微胶囊文献综述和参考文献
浅议电视节目主持人的策划意识
数据采集技术文献综述和参考文献
糖基化处理对大豆分离蛋白功能的影响
洪泽湖常见水生经济动物资源现状的调查
msp430g2553单片机高精度差分GPS技术研究
慕课时代下中学信息技术课程教学改革
高校计算机辅助教学英文文献和中文翻译