关键词:
知识图谱
卷积神经网络
实体识别
关系抽取
推荐算法
摘要:
在大数据、人工智能技术和信息化不断发展和提升的时代,互联网为中学生的学习带来了重大变革,也催生出了大量的教育平台,让学生不仅可以从传统课本和书籍来学习知识同时还可以通过互联网来获取教育资源。这些平台在为学生的学习带来便利的同时,也出现了如“数据爆炸”、“信息过载”等问题,为中学生查找相关知识点信息和查询与学习相关的资源带来了巨大的挑战。知识图谱将客观世界中概念、实体及实体之间的关系以图的形式展示,便于人们对信息进行组织、管理和理解。推荐系统通过精密的算法设计,能够精准捕捉并响应学生的多元化需求,并且能迅速高效地为其推送个性化需求的信息资源。为了进一步增强推荐的准确度,推荐系统与知识图谱紧密结合,将知识图谱作为个性化推荐的辅助信息,利用知识图谱中各个实体之间的关系来提高推荐效果和提升推荐系统的性能。本文首先构建高中数学知识图谱,并将其作为推荐算法的输入数据实现知识点推荐部分。
在知识图谱构建过程中的命名实体识别部分提出RCBC模型(即Ro BERTa-CNN-Bi LSTM-CRF模型),用于高中数学知识实体的识别任务。首先利用Ro BERTa模型中的双向Transformer编码层对数据的特征进行提取并分析生成相应的词向量,然后利用卷积神经网络(CNN)中的卷积层和池化层实现降维操作,提取句子中的局部特征,最后构建适合高中数学知识点实体识别的Bi LSTM-CRF模型进行训练和处理。经过实验表明,该模型的精确率、召回率和F1值分别达到94.32%、94.58%、94.45%。
在知识图谱构建过程中的实体关系抽取部分提出改进的GCN模型,用于高中数学知识实体的关系抽取任务。在GCN之上附加了两种类型的注意力模块,它们分别对空间和关系维度的语义相互依赖关系进行建模。位置注意力模块通过节点内部特征的所有位置的特征的加权总和,有选择地聚合每个位置的特征。同时,关系注意力模块通过整合所有节点之间的关联特征,选择性地强调相互依赖的节点关系。将两个注意力模块的输出相加,精确的提取结果。经过实验表明,该模型的精确率、召回率和F1值分别达到72.5%、65.9%、66.8%。
在推荐算法部分提出RGL模型,该模型先利用RED-GNN算法来捕捉知识图谱的结构信息,再运用LSTM构建注意力机制,来辨别知识图谱三元组之间的重要程度。通过遍历知识图谱,获取预测结果值。经过实验表明,该模型的hits@3、hits@5、hits@10和mrr评价指标上的数值分别为0.259、0.349、0.489和0.245。
最后,本文阐明基于知识图谱的高中数学知识推荐系统的设计与实现,包括知识图谱的展示、答题、学生管理和题目整理操作。高中数学知识图谱主要利用RCBC模型和改进的GCN模型进行实体识别和关系抽取完成知识图谱的构建。推荐系统主要利用RCBC模型识别错题中的实体,再利用RGL模型辨别与该实体关联程度最高的实体并查询相关题目。通过RCBC模型和RGL模型进行题目推荐,可以根据学生的做题记录为其推荐错误知识点的相关题目,并可以通过查询知识图谱更好的了解知识点之间的联系,增强学生对高中数学知识的整体结构的掌握,更好的提高学习效率和做题的准确率。