随着科技的进步以及智能手机的普及,人们逐渐养成了随时随地使用手机拍摄、分享图片的习惯。这促使了互联网中照片数量与日俱增。为了对如此巨大数量的图片进行管理,人们提出了对图片进行标注,即为图片添加标签,以提高图像检索的性能。而手工地为海量的图片添加标签是一件非常费时费力、主观并且难以实现的任务。因此,自动为图片分配相关标签的标签推荐方法引起了特别的研究兴趣。相比手工添加标签,自动标签推荐更加的客观、高效。目前,图像标签推荐技术主要包括两大类:一是基于浅层学习的图像标签推荐技术,一是基于深度学习的图像标签推荐技术。对于基于浅层学习算法的图像标签推荐技术,大都是对图像原始数据进行预处理,对图像特征进行提取(如颜色特征、纹理特征或者SIFT特征等),然后使用统计学习的方法,为图像推荐标签。例如:文献[2]提出了基于多例学习的启发式SVM算法的推荐技术,文献[3]提出了基于贝叶斯集成分类器的推荐算法。文献[4]提出了基于AdaBoost算法的推荐技术。对于基于深度学习的图像标签推荐技术,不同于浅层学习的方法,它不需要人为地指定图像特征的提取方法,而是通过计算机对庞大的训练集进行训练,自动抽象出图像数据中的关键特征,进而为图像推荐标签。例如,文献[5]提出了基于Dropout深度网络的推荐技术。Socher等人提出了一种基于周期神经元网络的算法来进行场景标注[6]。Wang等人基于自编码神经网络,改进了双模模型,实现了图像标签推荐[7]。82600
考虑到深度学习的优势,本文采用使用深度学习中的卷积神经网络来对图像进行分类训练,将图像的类别信息作为图像的推荐标签,进而实现图像的标签推荐。
参 考 文 献
[1]Ulges A, Worring M, Breuel T。 Learning Visual Contexts for Image Annotation From Flickr Groups[J]。 IEEE Transactions on Multimedia, 2011, 13(2):330-341。
[2]路晶, 马少平。 使用基于多例学习的启发式SVM算法的图像自动标注[J]。 计算机研究与发展, 2009, 46(5):864-871。
[3]张华忠。 基于贝叶斯集成分类器的自动图像标注[D]。 西南交通大学, 2012。论文网
[4]王小平, 李柳柏。 基于AdaBoost算法的图像自动标注[J]。 西南大学学报:自然科学版, 2015, 37(7):174-180。
[5]杨阳, 张文生, 杨雪冰。 基于Dropout深度网络的两步图像标注算法[J]。 计算机科学与探索, 2015, 9(12):1494-1505。
[6]Socher R, Lin C Y, Ng A Y, et al。 Parsing Natural Scenes and Natural Language with Recursive Neural Networks[C]// International Conference on Machine Learning, ICML 2011, Bellevue, Washington, Usa, June 28 - July。 2011:129-136。
[7]Wang W, Ooi B C, Yang X, et al。 Effective multi-modal retrieval based on stacked auto-encoders[J]。 Proceedings of the Vldb Endowment, 2014, 7(8):649-660。
[8]高常鑫, 桑农。 基于深度学习的高分辨率遥感影像目标检测[J]。 测绘通报, 2014(S1):108-111。
[9]Hinton G E, Salakhutdinov R R。 Reducing the dimensionality of data with neural networks。[J]。 Science, 2006, 313(5786):504-507。
[10]谢毅, 陈兴国。 浅谈深度学习[J]。 科教导刊:电子版, 2015(2):187-188。
[11]Fukushima K。 Neocognitron: A self-organizing neural network model for a mechanism of pattern recognition unaffected by shift in position[J]。 Biological Cybernetics, 1980, 36(4):193-202。
[12]Hubel D H, Wiesel T N。 Receptive fields and functional architecture of monkey striate cortex[J]。 Journal of Physiology, 1968, 195(1):215–243。
[13]Lécun Y, Bottou L, Bengio Y, et al。 Gradient-based learning applied to document recognition[J]。 Proceedings of the IEEE, 1998, 86(11):2278-2324。