目标检测的研究历史与现状目标检测并不是一个容易解决的问题,由于物体的尺寸变化范围很大,摆放物体的角度、 姿态不固定,而且物体还可能是不同类别,导致其计算复杂度较高,所以用一般的方法比较难处理。所以在卷积神经网络和深度学习出现之前,目标检测是一个较为沉寂的领域。2010 年-2012 年图像检索技术主流模型是可变部件模型(Deformable parts models)[8], 其平均准确 率均值(Mean Average Precision)大约为 43%。2012 年开始,随着深度学习以及深度卷积网 络进入人们的视线,目标检测领域也渐渐出现了新的思路:感兴趣区域提取(Region Proposal) 结合卷积神经网络(Convolutional Neural Networks)。基于此思路,2014 年出现的 R-CNN 平均 准确率均值(mAP)约为 58%、2015 年出现的 Fast R-CNN 将平均准确率均值(mAP)提高 至 68%、之后出现的 Faster R-CNN 平均准确率均值(mAP)达到了惊人的 73%。至此目标检 测领域的脉络也被固定了下来。77213
2 图像匹配的研究历史与现状
图像匹配的关键即对图片进行特征提取,通过图像的特征来描述该图像。常用的图像特 征包括尺寸不变特征变换特征(Scale-invariant feature transform)[6],其尺度不变性,可以良 好的处理图片中物体的旋转、移位和空间变化;梯度直方图特征(HOG)[7],计算图像局部区 域的梯度直方图,可以抗光照和形变论文网,尤其适合进行人体匹配;指纹算法函数,缩小图片以 计算图片的哈希值进行比较,简单快速,适用于根据缩略图找原图。