关键词:
自然语言处理
情感分析
深度学习
情感词典
特征向量
摘要:
随着互联网的发展及电脑、手机的普及,越来越多的人通过网络渠道发表自己的看法,其中又以文本载体为主。这些文本形式的评论蕴含丰富的价值,但如何从海量的文本数据中提取这些价值成为情感分析任务研究的重点。目前基于情感词典技术的情感分析方法通过情感规则和情感词典计算文本的情感倾向,受限于算法和词典的完备程度,基于深度学习技术的情感分析方法通过多层神经网络训练学习文本的上下文特征参与分类,缺少外部情感信息,两者都有各自的局限性。
本文针对文本情感分析工作,提出了基于改进特征向量的情感分析方法,在以深度学习技术为核心的情感分析模型基础上,融入情感词典中的文本情感信息,将深度学习模型输出的语义向量与情感词典算法输出的情感向量进行结合,并给出了两种结合方案。第一种方案是在句维度进行结合,将文本通过情感词典算法计算出情感得分,再将其转化为One-Hot向量,并与Embedding矩阵相乘转化为情感向量,与深度学习模型输出的语义向量拼接后输入决策层。第二种方案是在词维度进行结合,筛选文本中的情感词,对情感词进行编码与预处理,并根据情感词的类型赋予一个标记向量,将两者结合后输入深度学习模型产生情感向量,再与深度学习模型的输出向量拼接进行决策。经过数据集实验验证,本文提出的两种模型在Accuracy、Precision、Recall和F1值四项指标上均有不同程度的提升。
针对上述两种方案,本文进一步改进融合,提出了多通道决策模型。它以三个不同的子模型为基础,接收子模型的中间向量,通过综合决策算法筛选出决策向量参与文本情感倾向分类,得到比任一子模型更为准确的结果。本文设计了一系列实验验证了本文所提出模型的有效性。
此外,为了展示模型效果,并且方便用户查看目标商品的相关词、商品标签,及不受默认好评等因素影响的真实好评率等信息,本文设计并实现了商品评论情感分析系统。该系统通过用户输入商品页面地址,后台使用本文模型对商品评论等信息进行情感分析和统计,数据在前台以可视化的形式提供给用户查看,辅助用户决定当前商品购买意愿。