本技术介绍了一种结合了多维度特征提取和深度学习网络的情感分析方法。该方法利用RoBERTa预训练模型来提取文本的上下文特征和关键词汇,并将这些特征转换为词向量,以进行更精准的情感分析。
背景技术
方面级情感分析(Aspect-Based SentimentAnalysis,ABSA)是自然语言处理(Natural Language Processing,NLP)中的一项重要任务,其核心在于识别和分析文本中与特定方面相关的情感信息,而非简单地对整个文本进行情感分类。例如,在一条酒店顾客评论“The appetizers are goodbut the service is too slow”中,评论者对“appetizers”(前菜)表示了积极情感,而对“service”(服务)则表达了消极情感。传统的情感分析方法通常只关注整个评论的整体情感倾向,无法精确区分文本中不同方面的情感表达,这在多方面情感表达的复杂语境中表现得尤为明显。为了应对这一挑战,ABSA技术应运而生,能够准确地识别文本中多个方面的情感倾向,并为细粒度的情感分析提供了技术支持。
随着社交媒体、在线评论和电子商务平台的发展,ABSA已在市场调研、品牌管理、客户反馈分析等领域得到了广泛应用。例如,企业可以通过分析用户对产品不同方面的反馈,了解消费者对产品特定功能的评价,并据此进行产品改进或营销策略调整。这种应用需求促使了ABSA技术的快速发展,也推动了该领域相关研究的深入展开。然而,当前ABSA任务在实际应用中仍面临诸多挑战。最主要的挑战是如何有效地建模文本中的方面词和与其相关的情感表达。近年来,基于成分树和依赖树的图神经网络(Graph ConvolutionalNetwork,GCN)技术在ABSA任务中的表现尤为突出。GCN模型能够有效地传递文本中的成分结构和语义依赖信息,从而增强了情感分析的准确性。此外,外部知识的引入也进一步提升了模型的表现,这些技术通过整合文本的结构化信息和外部背景知识,为ABSA任务提供了有力支持。
现有的一些研究工作虽然在某些方面取得了显著进展,但仍存在不足。首先,许多ABSA模型仅依赖单一粒度的信息特征表示或模型结构,这种方式虽然在某种程度上提升了性能,但未能充分利用文本中存在的丰富特征。文本中的语法结构、语义特征、外部知识和上下文信息往往相互关联,并共同影响文本中方面词与情感词之间的关系。现有的模型往往难以全面整合这些多维度的特征,导致其在应对复杂的自然语言文本时性能不足。因此,如何在ABSA任务中有效地获取和融合多粒度特征,从而准确捕捉文本中方面词与情感词之间的关联性,已成为亟待解决的技术难题。
针对上述挑战,近年来出现了许多新的ABSA方法和系统。例如,专利号为CN202011630698.7的专利公开了一种基于深度学习的方面级情感分析方法及系统。该发明采用基于区间特征的情感三元提取模型SUM-ASTE,利用双层的双向长短期记忆网络(BiLSTM)对文本中的方面词、观点词和情感极性进行提取和识别。该方法首先通过BiLSTM网络对每个词进行表示,并基于该表示识别出文本中的方面词。随后,融合观点词和方面词的距离信息,再通过注意力机制计算出相应的情感极性。这种方法通过多层深度神经网络模型对文本中的特定方面进行高精度的情感分析,有效提高了分析的准确性。然而,这类基于长短期记忆网络的模型在处理长文本时容易受到序列长度的影响,且在面对复杂句法结构时,其对方面词与观点词之间关系的建模能力有限。另外,专利号为CN202310284393.2的专利提出了一种基于知识蒸馏框架的方面级情感分析方法。该方法通过构建教师模型和学生模型,利用教师模型中提取的语法特征来指导学生模型中的语义特征提取,实现了在不使用语法结构图的情况下,同样能够获取文本的语法信息。该方法的优势在于缓解了用户评论中非语法结构带来的噪声问题,从而提升了ABSA任务的整体准确性。知识蒸馏的引入使得复杂模型的知识能够迁移到较为简单的模型中,从而在模型精度与计算资源之间达成了良好的平衡。但该方法在处理没有明确方面词的句子时仍存在局限,且知识蒸馏框架的训练过程对教师模型的依赖较高,模型的鲁棒性在某些场景下表现欠佳。
尽管上述研究在ABSA领域取得了显著进展,但现有方法在实际应用中仍存在一定的局限性。首先,传统的深度学习方法通常难以同时处理文本中的语法结构、语义特征和上下文信息。其次,现有模型对外部知识的利用有限,未能充分结合文本中的背景知识进行情感倾向判断。此外,许多方法在面对不同类型和长度的文本时,其性能波动较大,表现出不够稳定的泛化能力。
实现思路