图像的语义分割在图像研究领域中占有很重要的地位,是图像处理中很关键的一步,图像分割结果的好坏直接影响到视觉系统的性能,而图像分割技术也是一项基本难题。图像分割技术自20世纪70年代起一直受到人们的高度重视,发展至今,仍然没有一个通用的方法能很好地适用于各个场景的图像语义分割。目前的分割算法都在适用范围、分割精度等方面有不同程度的缺陷。图像分割的应用十分广泛,尤其在人工智能领域,比如智能机器人、无人机、无人车等等。图像分割技术通过一系列的方法,将原始的图像转化为研究所需要的更抽象的形式,使得上层的及其分析成为可能,因而图像分割技术一直得到众多研究人员的高度重视。目前图像语义分割应用比较广泛的算法大体上可以分为三类:分类标注算法、概率关联模型标注算法以及基于图学习的标注算法[1]。本文所采用的方法属于第三类,即基于图学习的标注算法。
最近几年,条件随机场(CRF)由于具有表达长距离依赖性和交叠性特征等问题的优点,而且所有特征可以进行全局归一化,能够求得全局的最优解,并且能充分体现其智能化的特点,尤其在文本词性标注和图像语义分割等方面的性能优势如今得到了广泛发展,对其的研究逐渐成为主流。
如今的社会,随着互联网的迅速普及和高速发展,信息量也呈爆炸式增长。因而对于图像分割处理提出了更高的要求,缩短处理时间,提高图像的处理效率已经成为必然趋势。条件随机场(CRF)由于其智能化的优点,可以通过自主学习来不断地完善模型,所以可以适应各种不同的场合,真正的做到准确性和智能化的兼顾。而由于条件随机场模型可以重复性利用,所以极大减轻了图像处理工作的负担,同时也达到了快速的要求。
1。2 国内外研究现状
1。3 本文的工作
本文的主要工作首先利用读入若干训练图像,对每一个图像平均分成若干个8×8的图像块,对每一个图像块利用C++编程实现其颜色直方图、纹理直方图作为图像块的颜色特征和纹理特征。然后读入侧视图像,同样的将图像平均分成若干个8×8的图像块,对每一个图像块利用C++编程实现其颜色直方图、纹理直方图,然后利用朴素贝叶斯分类器(Naive Bayes classifier)求得每个图像块属于每一标签类别的概率,再对所得的概率值取对数加上图像的位置和暗通道先验信息,对相加的值取反,所得的值作为条件随机场优化函数的数据项的代价,然后设置不同的平滑项的值,比较最终的分割结果。本文的所有算法均用C++实现,工作重点主要有以下几个方面:
1)特征提取
本文对于图像的特征提取包括颜色特征和纹理特征,通过C++编程实现图像的颜色和纹理特直方图作为图像的颜色特征和纹理特征。关于图像的特征提取我查阅了很多相关资料,参考了很多C++和MATLAB的代码,具体的实现会在下文中作详细介绍。
2)图像标注
这部分内容首先通过提取每个图像块的颜色特征和纹理特征,然后通过暗通道处理和位置先验信息提高分类的准确性,利用朴素贝叶斯分类器(Naive Bayes classifier)对每个小图像块进行分类,最后利用条件随机场(CRF)模型对标签图像进行平滑优化。具体实现会在下文中作详细介绍。
1。4 本文的结构安排
本文内容分为五张,具体内容如下:
第一章:绪论。包含课题的研究背景和意义,国内外课题的研究现状以及本文的主要工作。
第二章:主要介绍基于朴素贝叶斯分类器(Naive Bayes classifier)的图像特征提取作为条件随机场模型的数据项