自动邮政分拣系统传统上依赖在光学字符识别(OCR)技术。OCR系统在平邮件方面表现良好,但是在包裹方面的性能恶化。在这研究中,我们提出一种新的多通道解决方案,就是荷兰国际集团研发出来的将自动语音识别(ASR)与OCR技术就相结合的方案可以提供更好的性能。我们的多通道的方法是基于估计OCR输出信号。然后有选择地使用ASR系统输出当做光学字符识别结果显示低的信号。特别是我们提出了一种基于编辑距离的措施计算OCR的信号。基于OCR的信号测量、动态融合策略的开发形式,它最终决定仅基于ASR和OCR输出。拟议的系统评估在语音和图像数据在现实条件下收集。我们的实验显示提出的多通道达到一个整体的解决方案并且邮政编码的识别率为90.2%,这是一个巨大改善了ASR独自孤单(和OCR系统。这个进步代表一个重要贡献在利用OCR和ASR技术改善包裹地址。论文网
索引词——包裹分拣的自动语音识别、光学字符识别、地址识别
介绍
包裹自动排序和分类,然后由大型的机械直邮向目的地。包裹分拣提供了更快的速度、效率和可靠性,降低运营成本。包裹分拣的关键一步是利用电气自动方式将包裹自动排序并且可靠的自动识别个人邮件地址信息。传统上,光学字符识别(OCR)已经被广泛应用阅读邮件地址。而OCR执行好平邮件等信封,在公寓通常面向更加一致,并提供强大的黑色字体在白色背景之下产生的更好的OCR的性能。然而,在包裹地址标签不一致,往往覆盖着塑料,和包裹本身可能是形状不规则的导致贫穷光学字符识别的性能。因此,有必要改进包裹的地址自动识别精度。
在本研究中,我们探索使用自动的语音识别(ASR) 可能性保证包裹地址识别精度。这种方法结合OCR和ASR系统。在这里,它是一定要注意,包裹分类机通常由一个人操作,他的主要工作就是拿起包裹,把它往分类机传送带。在提出多通道的解决方案,运营商分配给他次要的工作,他可以读地址标签而将这地址输入移动电话。通过这种方式,必要的ASR的语音输入系统可以获得。同样重要的是要注意操作过程中最小的影响运营商,必要时只需要说话的邮政编码。
提出了多通道的方法是可以让ASR和光学字符识别系统独立工作,解码之后将它们最好的结果结合起来提供优越的性能。组合逻辑检查OCR和输出生成一个信号得分。如果OCR输出件给出了高信号,然后ASR不用于输出最终的处理结果。另外,如果OCR 将产生较低的信号,可是OCR的输出不受利用,ASR输出仅用于过程荷兰国际集团的最终输出。OCR和ASR输出用于过程最终结果。为了OCR的输出在高、中、低的信号基于LED的测量非常高效和有效地利用ASR输出当OCR 。
一般来说,一种包裹分拣机的声学环境是嘈杂的,主要是机器零件移动产生的噪音。这噪声往往是不稳定的和降低ASR性能精度。在本研究中,我们也一样使用生理麦克风检查可能性语音输入。与传统的亲密交谈麦克风不一样的,PMIC麦克风帽是一个联系皮肤温度的语音信号通过振动。这研究比较了PMIC中医和恶魔的性能电吉他PMIC的噪声鲁棒性。
我们评估和报告的结果提出mul -timodal解决方案在现实的图像和语音数据集,邮政邮寄地址收集图像标签分选机机器在操作条件下使用,由构件中遇到现实世界的情况。我们的实验表明,所提出的多通道的解决方案通过减少数量优于OCR-only基线错误的50%。该系统目前是西门子移动邮政自动化的一部分解决方案
- 上一篇:液压系统的英文文献及中文翻译
- 下一篇:鄂式破碎机耐磨衬板英文文献和中文翻译
-
-
-
-
中国传统元素在游戏角色...
NFC协议物理层的软件实现+文献综述
上市公司股权结构对经营绩效的影响研究
C++最短路径算法研究和程序设计
巴金《激流三部曲》高觉新的悲剧命运
现代简约美式风格在室内家装中的运用
g-C3N4光催化剂的制备和光催化性能研究
高警觉工作人群的元情绪...
浅析中国古代宗法制度
江苏省某高中学生体质现状的调查研究