关键词:
线上教育
线上课程学习数据
学生成绩分类预测
成绩预警系统
摘要:
随着信息技术的迅猛发展和普及,线上教育突破了传统线下教育在时间和空间上的限制,实现了优质教育资源的共享,从而吸引了大量学习者的积极参与。然而,线上教育也面临着高辍学率、低通过率等挑战。由于线上学习形式的多样性和学生群体的庞大规模,教师难以有效识别出存在学习风险的学生,进而难以为他们提供针对性的辅导与支持。
为应对这一挑战,学生成绩分类预测成为线上教育领域的关键研究点。通过分析线上课程的学习数据,可以预测学生是否能通过课程,进而识别并干预风险学生。目前,大量研究者利用线上课程学习数据中学生对学习资料的点击行为数据进行学生成绩分类预测研究,取得了良好的效果,但这些研究在数据利用方面仍显不足。具体而言,现有研究对学生点击行为数据的分析不够深入且角度单一,导致模型预测性能受限。此外,在课程早期阶段,由于学生点击行为数据的匮乏,部分模型面临冷启动问题,预测效果不佳。基于此,本研究从多个角度对学生点击行为数据进行深入分析来建立成绩分类预测模型,并引入学生背景数据以缓解分类预测模型的冷启动问题。最后基于预测模型建立学生成绩预警系统,从而为教师提供有效的决策支持。
具体而言,本文的研究内容主要包括以下几点:
(1)为了从时序与局部两个角度分析学生点击行为数据,并缓解成绩预测模型的冷启动问题。本研究提出了一种基于双分支网络DNN-CBLM的成绩分类预测模型。该模型结合了基于CBLM的学生点击行为特征提取网络模块与基于DNN的学生背景特征提取网络模块。在CBLM模块中,利用一维卷积神经网络(1DCNN)捕捉点击行为数据的局部特征,并通过双向长短期记忆网络(Bi-LSTM)挖掘时序特征,为了使输出更关注与学生成绩更相关的特征,引入了多头注意力机制对其输出赋权值,并在注意力机制中融入残差模块以增强模型特征表达能力。此外,DNN模块旨在利用学生背景数据弥补早期阶段点击行为数据不足的问题。在课程初期,学生的点击行为数据相对有限,但其背景数据是完整的。因此,通过深度神经网络(DNN)对学生背景数据进行特征提取,能够在课程早期阶段为模型提供有力的数据支撑,从而提高早期预测的准确性。在大量实验中,DNN-CBLM成绩分类预测模型都取得了良好的预测性能,并有效提高了模型在课程早期的预测性能,充分验证了模型的有效性。
(2)在DNN-CBLM成绩分类预测模型的基础上,为了全面分析学生点击行为的整体特征、时序特征与局部特征,并结合学生背景特征缓解模型冷启动问题,本研究提出了一种基于改进粒子群算法优化的Stacking成绩分类预测模型(IPSO-Stacking DXLL)。该模型在双分支网络DNN-CBLM的基础上进行了改进,通过引入Stacking集成算法将DNN-CBLM、XGBoost、Light GBM作为基学习器、逻辑回归(LR)作为元学习器,构建了一个性能更为强大的Stacking DXLL成绩分类预测模型。在模型构建过程中,根据不同特征的特点,选择不同的基学习器提取各类特征,其中,XGBoost和Light GBM用于提取学生点击行为的整体特征和学生背景特征,DNN-CBLM则提取学生点击行为的时序特征、局部特征与学生的背景特征。模型通过集成这三种基学习器,实现了对学生点击行为的整体特征、时序特征、局部特征全面分析,同时结合了学生背景特征用于缓解模型冷启动问题。此外,为了进一步优化模型的预测性能,本研究提出了一种改进粒子群算法(IPSO),相较于传统的粒子群算法,IPSO在算法结构和搜索策略上进行了优化,使其在收敛速度和优化性能上均有了提升。在一系列的预测实验中,IPSO-Stacking DXLL都取得了最优的预测性能,充分说明了该方法的有效性。
(3)为了为线上课程的教师提供一套切实有效的工具来识别并预警风险学生,本研究在提出的IPSO-Stacking DXLL成绩分类预测模型基础上,设计并实现了一种基于Spring Boot-Vue框架的学生成绩预警系统。该系统能够利用成绩分类预测模型对学生的线上课程学习数据进行分析,预测学生成绩,为教师提供及时的成绩预测结果。通过该系统,教师可以发现存在学习风险的学生,并为他们制定个性化的学习改进计划。这些计划将通过系统直接发送给学生与其监护人,帮助学生调整学习策略,提升学习效果。