关键词:
数字图像处理
模式识别
批量字符识别
特征提取
神经网络
摘要:
光学字符识别作为文字自动输入的一种方法,在许多行业,如银行,航运,商业,通信等都有广泛应用。它能够很大程度提高信息获取速度,减轻人们机械工作强度。多年来,光学字符识别技术已成为许多研究者的研究目标,虽然已取得很多成就,但是还存在很多问题,无法很好满足一些实际需求。因此,研究字符识别的关键技术,寻找合理的改进方案,提高字符识别系统的性能具有重要意义。 本文基于数字图像处理技术和模式识别技术研究批量识别扫描字符图像的关键技术,主要工作包括以下几点: (1)详细介绍几种图像二值化处理方法,对比其处理效果。针对目标区域和背景区域分布不均,难以分离的问题,提出并实现基于局部迭代的Otsu改进算法,通过实验验证其有效性。针对传统倾斜字符图像校正方法过程复杂,适应性差的问题,采用基于傅里叶变换的小角度倾斜校正算法和基于水平垂直投影的区域定位算法,减少冗余信息处理,提高后续目标分割精度。根据实际字符图像版面特征,采用区间扫描法对多行文本进行快速分割,实现单个字符准确提取。 (2)简要介绍几类用于字符识别的特征提取方法。针对实际测试的字符图像特点,将字符骨骼化后抽取外围轮廓特征和穿透特征,组合为单个字符特征数据集,从而提高系统识准率。对应用广泛的误差反向传播神经网络进行研究,通过动量项和学习率整体自适应的方法,针对BP网络本身网络收敛速度慢、易陷入局部最小值等缺陷进行改进,实现改进的分类器,并以实验验证其优越性。 (3)完成整个字符识别系统的设计、实现与测试。 实际测试结果表明:本文提出的算法和设计的系统是有效可行的,系统对于清晰度较高和倾斜度较小的扫描字符图像识别率接近100%,同时整个系统的算法简单,复杂度低,能够满足快速识别的要求。