集装箱的残损位置及类型识别在实际应用中也有不小的价值。首先,全自动的集装箱残损检验可以节省人工成功;其次,集装箱在通过关卡时要经历人工验残,人工检验的情况下,车辆要停车检验,这大大限制了集装箱的流通速度。自动化的集装箱残损检测实现后,集装箱通过关卡时不再需要因为残损检测而停车,可以提高集装箱关卡的流量。同时,自动化的检测可以大幅减少人工成本,降低集装箱流通费用。
1。3 相关技术
1。3。1 基于神经网络的图像识别
图像识别[1]是人工智能的一个重要方面,在现代自动控制技术及第五代电子计算机中都占有极重要的地位。它创始于五十年代后期,在六十年代初开始崛起,仅仅二十多年就受到许多学科的广泛重视,并在科研与工业生产中得到了应用。80年代,人工神经网络研究再次兴起,为图像识别技术提供了新的途径。
国外的神经网络识别技术起步较早[1],目前已经能够做出实验室,并在图像信息处理中得到应用。国内对神经网络图像识别技术研究起步比较晚,但是研究发展规模大,速度快,已经取得了不少成果。1988年由北京大学组织召开了第一次关于神经网络的讨论会,一些国际知名学者在会上做了专题报告。1990年我国的863高技术研究计划,批准了关于人工神经网络的三项课题,自然科学基金与国防科技研究基金也都把神经网络的研究列入选题指南,对中选的课题提供研究上的资助。
传统的基于神经网络的图像识别存在一些缺陷[1],比如样本训练输入和输出要一一对应、识别速度不如模糊系统快等,神经网络技术与模糊理论、证据理论、贝叶斯决策理论等技术相结合进行图像识别已成为神经网络图像识别技术的发展趋势。
1。3。2 显著性检测
人眼可以快速有效地定位到图像中有特色的区域,也叫做显著区域。这些区域的图像会被更细致地发掘和处理以获得更丰富的信息。人眼的这个能力吸引了很多人研究,它可以很有效地提取图像中的目标物体,在模式识别、深度学习等领域中均有很大的价值。
显著性检测[2]的本质是一种视觉注意模型(Visual attention model,VAM)。研究表明,人们产生注意力有两方面的原因:一方面是视觉刺激引起的注意,另一方面是基于任务驱动的主观注意。因此VAM分为两种类型:自底向上的数据驱动注意模式和自顶向下的任务驱动注意模式。
目前,在显著性检测中,自底向上的模型是比较常见的[3],这类方法主要利用颜色、边缘、纹理等底层特征属性来度量图像区域与其周围图像区域的差异性。根据是否对图像进行频域变换,可以宽泛地分为两类:
(1)空间域模型
经典的Itti模型,根据人眼视觉特性,采用高斯金字塔进行非均匀采用生成多个尺度图像,对这些尺度图像的底层特征进行计算,包括图像的颜色、亮度、方向等,之后根据中央周边差计算各个尺度上的关注图,最后对关注图进行融合得到显著图。另外还有很多改进的方案。文献综述
(2)频域模型
基于频域的显著性模型[4]是近年来逐渐兴起的显著区域检测模型,其主要思想是首先把图像从空间域变换为频域,然后通过分析频域信息,找到其与显著性特征的关系。代表方法有Hu等提出的特征值极坐标变换方法,此方法将图像从空间域变换为的线性子空间坐标内,并对子空间内呈线性的特征值进行分析并抽取,分析该子空间内分布的线性部分,进而找到显著性区域。
1。3。3 不变矩