关键词:
OA信息资源
深度学习
卷积神经网络
摘要:
近年来基于OA(Open Access开放存取)的信息资源品种数量越来越多,但是我们发现OA信息资源在高校图书馆和一些资源整合平台上存在学科分类简化单一,整合率不完善的状况。导致用户在查找OA信息资源时,很难准确定位和精确地找到自己所需的学科资源。因此,选择科学有效的分类方法以实现OA信息资源的快速检索、准确定位在OA信息资源利用过程中显得至关重要。依托深度学习在文本分类领域的应用发展,本文选择深度学习的卷积神经网络作为O A信息资源分类改进的技术基础开展相关研究,实现借助人工智能的分类方式,为OA信息资源服务平台的信息处理人员提供一种新的学科分类思路,进而帮助用户更快速和精确地获取基于OA的相关信息资源,提升检索效率。本文首先将汉语主题词表学科分类作为OA信息资源的学科分类的参考,辅助OA信息资源实现更多的学科精确分类,通过学科最终分类确定关键字在平台上获取OA信息资源,对获取到的OA信息资源进行处理,最终得到OA信息资源的数据集。接下来对OA信息资源数据集进行文本预处理,利用我们构建的卷积神经网络模型结构实现对OA信息资源实现自动分类,观察卷积神经网络对OA信息资源的准确度,结果发现卷积神经网络对OA信息资源的文本分类是比较理想和适用的。由于OA信息资源在各学科下的文本数目不一致,分别选取十个学科下文本数目分布均匀和分布不均匀的OA信息资源数据集,利用卷积神经网络实现分类准确度,最终发现均匀分布的OA信息资源数据集比不均匀分布的OA信息资源数据集的分类效果好。最后提出基于原先设计的卷积神经网络,在网络结构、卷积核尺寸和卷积核个数三个方面改变卷积神经网络的结构,观察改变后不同卷积神经网络模型结构对OA信息资源文本分类的影响。实验结果显示改变卷积神经网络的结构,卷积核层数有两层的卷积神经网络对OA信息资源文本的分类效果较好;改变卷积神经网络的卷积核尺寸,卷积核尺寸为(2,3,4,5)的卷积神经网络对OA信息资源的分类效果会相对提高;改变卷积神经网络的卷积核个数,卷积核个数为128的卷积神经网络更适用于OA信息资源的文本分类。本文提出的基于深度学习的OA信息资源文本分类能够给科研人员提供更优质的OA信息资源信息服务。