关键词:
数学公式
公式定位
符号分割
字符识别
摘要:
随着计算机技术和互联网技术的快速普及与迅猛发展,用户对书籍及文献资料的电子信息化需求越来越大,书籍及文献资料的电子信息化不仅包括电子化存储,还包括对内容的分析与理解等。随着字符识别技术的发展,光学字符识别对于电子信息化的书籍文献中的英文字符和数字等具有很好的识别效果,但是由于书籍文献中的数学公式符号存在种类复杂、尺寸变化大、二维嵌套结构等难点,数学公式的定位与识别方法的精度还不能满足实际需求。本文以文本中数学公式的精确定位与识别为目标,研究了不同版面下的公式定位以及公式中的数字、运算符号、希腊字符、英文字符的特征提取和识别。论文的主要工作如下:(1)对数学公式的图像进行了预处理。预处理包括去噪、倾斜校正、图像细化以及毛刺去除等操作,为公式符号的分割及识别打下了基础。(2)分析了书籍文献的版面结构特点和文本中数学公式的排版位置特征等,给出了一种基于投影法的数学公式定位方法,该方法能够准确地将文本中的公式进行定位提取。(3)投影法是数学公式符号分割普遍采用的方法,但该算法只对于结构简单、无角标、无层次结构的数学公式分割有效。为了分析处理复杂的二维嵌套结构数学公式,本文研究并给出了一种改进的基于连通域的数学公式符号分割方法,该方法实现了嵌套结构数学公式中字符的精确分割。(4)特征提取与分类器是数学公式符号识别的关键环节。考虑到公式字符的多样性,本文给出了一种多特征融合的特征提取算法,融合的特征包括孔洞特征、交截特征、网格区域特征、不变矩特征。为寻求公式字符的最佳分类效果,本文分别采用了模板匹配、人工神经网络、SVM三种分类方法。实验结果表明,基于多特征融合和SVM的分类方法精度较高。另外,对于相似字符采用基于模板匹配的二次分类方法,有效的提高了公式字符识别的精度。