1。4 相关发展现状
1。5 本文的组织结构
本文的结构如下:
第 1 章,介绍了本论文的研究背景,自然场景下集装箱识别系统的价值,实现快速箱号 识别使用的相关核心技术。除此之外,还介绍了光学字符识别(OCR)以及国内外字符识别 和集装箱箱号识别相关的发展现状。
第 2 章,介绍了集装箱箱号识别系统的整体架构,详细分析了各个模块所使用的核心技
术以及理论基础。
第 3 章,详细阐述了各个模块中的核心算法,主要以流程图的形式来表现,使用文字进 行辅助说明。
第 4 章,介绍了实验平台以及在该实验环境下使用不同技术处理同一问题的性能比较, 并对结果进行分析和论证。另外,也得出了本文使用的处理方案的准确率和识别速度等性能 指标。
第 5 章,对本文以及进行本毕业设计所做的工作进行总结,指出本系统现阶段仍然还存 在的潜在问题和可以改进的地方,并对于下一阶段工作做出展望。
2 系统整体架构
自然场景下集装箱箱号识别系统的系统整体架构如下:
图 2。1 自然场景下集装箱箱号识别系统架构
2。1 预处理模块
预处理模块的功能是将原始图像进行一系列的操作,并且最终得到能够进行识别的字符 图像。预处理模块主要分为以下几个部分:灰度化、二值化、降噪、切割、修正。每个步骤 都采用前一个步骤产生的结果作为输入。
2。1。1 灰度化
图像在计算机中的存储方式是矩阵,原始彩色图像是由RGB三通道灰度值合成的图像。 在实际的图像处理中,往往将彩色图转换为单通道的灰度图。在图像处理中,使用彩色图像 只会增加分析数据的时间和复杂度。然而一旦将彩色图像转换成灰度图,图像处理的矩阵的 大小就会缩减到了原始图的1/3,性能相应地提升了3倍,却不会丢失图像的主要内容。由于 人眼视网膜对R、G、B三个通道颜色的敏感度不同,所以不能直接采用三通道均值的方法来 得到灰度图,而是要采用心理学公式(2)。
Gray R 0。299 G 0。587 B 0。114 (2)
公式中的R、G、B分别代表红、绿、蓝三通道的灰度值矩阵。在对彩色图像进行灰度化 处理之后,原图中的特征和不同物体的层次依然能够得到保留,图像的特征能够非常完整的 保留下来,对之后的处理不会有太大的影响。对彩色原图像进行灰度化处理后的结果如图2。2。论文网
图 2。2 图像灰度化
即使对彩色图像进行灰度化,箱号文本区域与箱体背景的边界依然非常清晰,并没有因 为图像矩阵的缩小影响到图像内容的细节。
2。1。2 对比度标准化
在实际应用中,集装箱图像的采集的光照条件可能发生改变,需要做到不仅满足白天, 也要满足黑夜场景下都能得到对比度清晰的图像。我们提出在进行灰度化之后对图像进行对 比度增强。对比度增强主要是为了能够将不同灰度级之间的差距进行拉伸,可以更好地区分 稳定背景区域和文本区域。公式(3)是对比度增强的数学描述。
g(x, y) h( f (x, y)) (3)
f (x, y) 表示原始图像, g(x, y) 表示经过对比度拉伸或缩小后的图像, h 表示灰度映射函 数。对比度增强本质上是使用映射函数对原始灰度值进行映射,映射的方式主要由线性映射 和非线性映射组成。线性映射是将原始图像的灰度值定义域均匀地映射到目标灰度值定义域