关键词:
寻找相似习题
相似习题推荐
习题先修关系
习题表征
公式表征
智能教育系统
摘要:
近年来,智慧教育平台利用人工智能技术,向用户推荐适合的学习内容,在生活中发挥着重要的作用。在此背景下,如何更好地理解习题并建立准确的习题模型,对于提升习题推荐质量、提高教学效率具有重要的实践意义和应用价值。好的习题表征能够反映习题的考察目的和计算逻辑,体现习题的相似、先修等关系。本文通过数据分析,发现单纯依靠题干文本对习题进行表征,不能全面、准确地反映习题的考察目的和计算逻辑,而习题公式是解题逻辑符号化的体现,包含丰富的数理逻辑信息,因此,公式对于获得准确的习题表征具有重要价值。围绕着习题表征,学术界进行了很多研究,然而还是存在很多问题。具体来说,当前的习题表征模型主要有两点不足:(1)仅关注题干带来的信息,忽略了习题公式的作用;(2)没有针对习题间的先修关系进行建模。这些不足使得当前的习题表征模型的性能受到限制。为此,本文围绕习题的公式,设计了融合公式信息和题干信息的、能够体现相似和先修关系的两个深度习题表征模型。论文的具体贡献如下:(1)构建了一套较系统的数学习题数据集,包括2358道习题(覆盖24个知识点)用于相似习题检索;370道习题(包括70个模板,60条先修规则)用于先修关系判断。(2)针对相似习题检索的应用场景,提出了基于公式树的公式和题干文本深度融合的习题表征模型。该模型将题干中体现数学逻辑的数字的深度语义上下文表征,通过基于公式的树状神经元网络自下而上聚合,实现题干和公式信息的融合,得到习题表征。实验结果表明,该模型比基线模型的二分类AUC提高0.04,检索排序Precision@1、Precision@5和Precision@10分别提高0.02、0.04和0.05,取得了较好的效果。对具体习题的多角度分析结果也表明:模型获得的习题表征能够正确反映数学习题考察的数理逻辑。(3)针对习题先修关系判断的应用场景,提出了基于公式树节点注意力机制的习题先修关系判断模型。该模型通过比较两道习题的公式树结构以及树节点表征,感知习题的语义和计算逻辑的关系,然后使用基于公式树节点的注意力机制对感知结果进行融合,判断两道习题是否存在数学逻辑上的先修关系。实验结果表明:该模型比基线模型的二分类AUC提高了0.16,验证了模型的有效性。本论文设计的基于公式的数学习题理解和应用模型对推动智慧教育的研究进展有重要意义。