关键词:
隐式情感分析
词性标注
依存分析
BERT
语言学特征
摘要:
情感分析是自然语言处理中的热点研究方向,隐式情感分析是指无显式情感词的情感分析任务。隐式情感分析面临缺乏显式情感词、表达方式委婉、语义难以理解等问题,传统的情感分析方法如情感词典、词袋模型等难以生效,使得隐式情感分类任务更加艰巨。本文从语言学特征的角度,通过结合三种不同的隐式情感分类方法深入探讨不同种类语言学特征对于隐式情感分析的影响,具体包括如下三个方面:首先,针对隐式情感分析情感表达晦涩、主观性较强等难点,本文在特征表示的方面,通过不同种类的文本表示模型从不同角度获取文本表示的情感信息。一方面,该方法能够采用TextCNN、LSTM、BERT分别捕获句子不同粒度的文本特征,弥补了隐式情感句语义难以理解的问题。另一方面,该方法能够生成词性嵌入和句法嵌入,在语义特征中进一步融合词性特征和句法特征。实验结果表明,该方法提出的模型相比baseline在准确率和F1值上分别提高了 2.3%和2.8%,融合不同粒度的文本特征的模型表现优于单一的文本特征的模型,且融合语言学特征能够进一步优化模型分类效果。其次,针对隐式情感句缺乏显式情感词作为情感线索的问题,本文基于注意力机制深入分析不同语言学特征对于隐式情感分析的影响,提出了一种结合预训练语言模型和注意力机制的隐式情感分类方法。该方法通过依存句法关系为注意力机制生成掩码矩阵,从而在注意力机制中融合句法特征,使模型更加关注与情感表达关系密切的句法成分。实验结果表明,该方法提出的模型相比基线模型在准确率和F1值上分别提高了 1.7%和1.8%,能够提高模型对重要词性和句法的关注度,从而提升隐式情感分类的性能。最后,针对句法信息对于隐式情感分析影响的问题,本文提出了一种结合文本与依存关系的图神经网络模型来进行隐式情感分类。该模型能够抽取文本的词性特征和依存特征,构建结合语言学特征的图注意力神经网络。由于预训练语言模型在隐式情感分类任务中表现突出,本文采用BERT模型提取文本向量特征,并进一步对其进行改进,以增加词性特征。实验结果表明,该方法提出的模型相比基线模型在准确率和F1值上分别提高了 1.5%和2.3%,能够充分利用词性特征和依存句法特征,并提高模型对隐式情感句的识别能力。