1.4 研究方法与研究难点
本课题研究由以下几部分组成:
(1)图像预处理
获取图像,进行灰度转换,检测出边缘并做一定处理以方便之后的标识切割;
(2)标识切割以及特征向量的提取
对预处理后的图像行和列方向灰度值做累积和,利用峰值或谷值等一些极值点将标识部分切割出来,并选取合适特征向量;
(3)标识识别源.自/优尔·论\文'网·www.youerw.com/
使用预处理后的训练样本对神经网络进行训练,识别出标识并在界面输出。
在研究过程中应特别注意实际工程环境:具体要求有实时性(>1.5s/片),抗干扰性(污垢、切割痕等)和适应性(人工画线标记粗细、长短、轻重、抖动等不可避免的细微差异)。
英文字母的类别只有二十六种,笔画相对简单,是一个比较简单的分类问题[7],目前已经有一些比较标准的、预处理过的图像数据库在因特网上供研究者免费下载使用,也有不少针对手写英文字母的识别算法可以做到比较高的识别率,一些针对MNIST样本集的识别算法甚至可以达到99%以上的识别率[8]。
手写英文字母识别的主要难点有:
(1)每个人的书写习惯差异较大,有的甚至会造成字母变形厉害,对笔画长短、位置形态及其装饰均有影响;
(2)所用笔墨质量、瓷砖表面的凹凸、图像获取现场光线的明暗变化等均会对识别结果有影响;
(3)采集的待识别图像的质量与采集图像设备的优劣有直接关系[9]。
1.5 论文内容与结构
本文第1章引言部分介绍了课题背景以及OCR技术的发展和现状,概述了研究的意义、方法和难点;
第2章是识别系统的概述,从图像获取、传输、预处理和目标识别这四个方面介绍了现有的处理方法并比较了这些方法的优劣;
第3章介绍了在MATLAB环境下的一些本文涉及到的具体图像处理函数和神经网络工具箱;
第4章是识别系统详述,给出了辨识系统的处理流程、结果。