关键词:
子公式权重
公式相关度
计算机代数系统(CAS)
排序算法
摘要:
目前,Web中的数学信息量逐渐增加,数学搜索成为人们关注的焦点。近几年,浏览器对数学公式的显示和存储问题己得到逐步解决,为面向数学公式的搜索引擎的研究和开发提供了良好的基础。
尽管数学公式可以存储在web文档中,在网络中搜索数学公式仍具有局限性。数学公式具有复杂的二维结构以及蕴涵有复杂的数学表达意义,不同描述的数学公式可能具有相同的意义,同一数学公式的表示形式可能有多种,另外用户查询公式可能为某一公式的子公式,因此用传统的文本检索系统搜索数学公式显得力所不足。国际上现有的或者正在研究的数学公式检索系统,在建立索引方面已取得逐步发展,在返回结果集的排序算法方面大部分仍应用文本搜索引擎的排序算法,未深入研究面向数学公式搜索结果排序的算法。因此,本文将在深入研究现有的基于文本搜索引擎排序算法的原理和基础上,结合数学公式的特点以及数学公式间的关系(等价、代数相关、子公式等)尝试提出面向数学公式搜索排序的算法。本文将计算机代数系统(CAS)和数学公式搜索引擎相结合去挖掘公式与公式之间的关系,不但为查询公式和网页之间相关度的计算方面提供更加合理可靠的相关度量方法,还将促进系统对数学公式语义检索的能力。