关键词:
情感分析
句子级
方面级
深度学习
新闻评论
摘要:
随着自媒体的快速发展,政府越来越倾向于在社交媒体平台上发布新闻和政策,而公众对这些新闻和政策的情感倾向又会对政策的制定和执行产生影响。因此针对新闻评论的情感分析变得十分重要。情感分析可根据分析的重点和范围划分为句子级、方面级和篇章级情感分析。其中,句子级情感分析适用于短文本,普遍存在过拟合、局部特征提取不足等问题;方面级情感分析只根据文本中的不同方面进行情感分析,通常存在方面词和情感倾向难以匹配的问题。针对上述难点,结合新闻评论短文本、信息丰富、结构复杂等特点,本研究选用句子级和方面级情感分析方法,分别提出对应模型进行情感分析。具体工作如下:(1)提出融合Transformer与CNN的句子级情感分析模型。在BERT模型的基础上引入Transformer编码器,通过编码器中的多头注意力机制和Dropout,有效缓解过拟合问题,增强模型的泛化能力。改进的四通道双层CNN模型,通过组合不同尺寸的卷积核捕获文本的不同尺度特征,增强模型提取局部特征的能力。在进行消融实验和对比实验时,使用了三个不同的数据集,结果表明该模型在句子级情感分析任务上的表现优于其他模型,其准确率提高了1.2%以上,F1值提升了2.0%以上。(2)提出融合交互注意力机制的方面级情感分析模型。使用TF-IDF和LDA模型提取新闻评论的方面词向量,并引入交互注意力机制,将方面词向量与BE-MCNN模型提取的上下文向量相结合,通过提高方面词和情感信息之间的相关性,以解决两者之间的匹配问题。研究中构建了方面级情感分析数据集,并在数据集上进行消融实验和对比实验。实验结果表明,该模型在准确率和F1值上提升了3.5%和3.6%以上,证明了该模型在提高方面词和情感信息之间的相关性方面的有效性。(3)开发了基于深度学习的新闻评论情感分析系统。利用上述研究所提的算法对新闻评论数据进行情感分析。经测试表明,该系统不仅可以爬取固定网址内的评论数据,而且可以对评论数据进行句子级和方面级的情感分析,使用户具有良好的使用体验。