随着海量多媒体时代的来临,图像标注技术有助于提高图像检索的性能,而信息传播模型能够挖掘海量数据间的知识,有助于提高图像标注的性能。因此,本文重点研究了基于信息传播模型的图像标注,挖掘海量数据中的知识为图像标注相关标签。信息传播模型,即标签传播算法,是一种基于图模型的算法,能够将信息在各个节点上进行传播。此外,稀疏模型通过重构的思想能够有效的找到相关的图像子集即近邻图像构建图。本文主要研究了 K 近邻算法,稀疏算法和标签传播算法,为了解决数据量大的问题,本文研究了 K近邻稀疏图上的标签传播,有效的挖掘海量数据间的知识,将相关标签传播给图像。最后,本文在当年普遍使用的社交网络数据集NUS-WIDE 上对上述算法进行了验证。41531 毕业论文关键词 标签传播 图像标注 图像检索 半监督学习
Title Label-propagation-based Image Annotation
Abstract With the coming of the time of media information, image annotation technologyhelps to improve the performance of image retrieval, and labels propagation modelcan tap the knowledge among amounts of data which helps to improve the performanceof image annotation. Therefore, this article focuses on the image annotation basedon label propagation which mining the knowledge among amounts data to annotatelabels for the images. Information dissemination model means label propagationalgorithm which is an algorithm based on graph model with the ability to spreadinformation among each node. In addition, sparse model can effectively find animage to construct diagram with the idea of restructing. This paper studies theK nearest neighbor algorithm, sparse algorithm and label propagation algorithm.In order to solve the problem of large data, we studied the spread of K nearestneighbor sparse label on the graph which can effectively mine knowledge among theamounts data to spread the related tags to the images. Finally, in this paper,theabove algorithms were validated on the social network data sets NUS-WIDE commonlyused in those days.
Keywords label propagation image annotation image retrieval semi-supervisedlearning
目 次
1 引言 1
1 . 1 研究背景及意义 1
1 . 2 本文主要研究内容 3
1 . 3 本文组织结构 4
2 图像标注技术的研究背景及意义 5
2 . 1 图像自动标注模型的发展过程 5
2 . 2 图像语义自动标注的发展历程 6
2 . 3 图像语义自动标注的评价准则 8
3 信息传播模型 9
3. 1 信息传播模型的描述 9
3. 2 信息传播模型的衍生模型 11
4 基于信息传播模型的图像标注 16
4. 1 图像标注的分析 16
4. 2 图像标注的基本算法与框架 16
5 实验部分 18
5. 1 实验所用数据 18
5. 2 实验流程 18
5. 3 实验结果 18
5. 4 实验演示 23
结论 26
致谢 27
参考文献28
1 引言1.1 研究背景及研究意义
1.1.1 图像检索技术的发展随着海量多媒体时代的来临,数字影像技术与互联网技术迅速发展,在互联网上流动着以数百亿为计量单位的海量图像,而如何能够快速的检索到用户所需求的图片,就成了一个关键性的问题。目前商业化的一些图像搜索引擎例如 baidu、Google、Yahoo等主流还是以文本关键字的形式来进行搜索,而其关键字则主要是通过人工或自动标注完成,这其中的工作量巨大,缺乏一定的客观性,准确性。早在 20 世纪 70年代开始,有关图像检索的研究就已经展开了,成为了一个新兴研究方向,当时主要是基于文本的图像检索技术(Test-based Image Retrieval,简称 TBIR) ,这种方法回避了图像本身的视觉内容,从绘画作品的作者、年代、流派、尺寸等信息来索引图像。在实际用作的时候,该技术大多以关键词作为输入信息来查询图像,这样就将对图像的检索转换成了对相应文本的检索, 而现今不少图像检索引擎也在这方面用着相对比较成熟的技术。但目前,这种基于文本的图像检索技术还存在着这样的几个缺陷: