关键词:
人工智能
图注意力网络
自动求解数学应用题
SAU模型
摘要:
近年来,人工智能技术发展迅速并且在很多领域应用比较广泛,例如在医疗健康,交通出行和金融行业等领域发挥着重要作用,同时在智慧教育方面的应用吸引了许多学者的关注。自动求解数学应用题(MWP)就是其中的一个热门方向,难点在于如何让机器理解数学文本问题以及其中数字与文本的逻辑关系并根据这些信息推理出正确答案。关于自动求解MWP的方法也是不断地改进,与传统的方法相比,基于深度学习的方法在求解MWP的准确率上较高,典型的有DNS、GTS和SAU等模型,其中SAU模型在求解二元一次方程组应用题当中表现较好,但该模型在对问题背景知识的理解以及数学逻辑关系的提取方面有待进一步提升,所以本文基于SAU模型研究自动求解MWP,所做工作如下:
1.添加逻辑提示器。为了增强模型的语义解析和推理数学逻辑关系能力,本文在SAU的输入部分引入逻辑提示匹配器,通过将问题本身包含的数学逻辑关系式与逻辑关系库进行匹配,从而输出与问题相关且得分高的数学关系式,最终结合问题文本一起作为编码器的输入。
2.加入背景知识库。目的是让模型能够更深入地理解到数学应用题中隐含的背景知识,所以本文基于SAU模型在Bi-GRU编码器的输出部分添加图注意力网络模块,通过实体图的形式获取问题中的知识感知表示,将隐含的背景知识与原问题中的数字信息进行连接,从而得到丰富的语义信息,最终送入树结构解码器中利用先序遍历的算法生成表达式树。
3.提出一个含有两个未知数的数学应用题数据集HBLE。该数据集是从在线教育网站上获取的含有两个未知数的数学应用题,我们进行了模板化处理,包括问题id、原问题文本、方程表达式以及答案。为了使模型具有较高的鲁棒性,我们针对数据集做初步处理,即利用回译式的数据增强机制通过调用百度API来实现对该数据集进行回译操作:中文→韩文→英文→中文,以此达到对原问题文本的数据增强效果。
在实验测试过程中,我们改进后的模型对于包含背景知识以及隐含的数学逻辑关系的问题均可以求解,并且准确率令人满意。本文在HBLE、HMWP、ALG514和Math23K数据集上均采用5折交叉验证的方式进行了实验,并与先进模型的做了对比分析。在HBLE数据集上,本文的模型在数学方程组应用题求解的准确率有着50.37%的精度;与SAU模型相比,在HMWP数据集上提高了4.42%的精度;在ALG514数据集上提高了3.04%的精度;在基准数据集Math23K上也有着0.57%准确率的提高。通过实验数据可以展现出本文模型具有较强的求解能力,在AI求解数学应用题的领域上具有重要的研究价值。