本申请公开了一种基于BERT的多特征融合实体情感分析方法及系统,所述方法包括以下步骤:对文本进行标注,获取实体情感数据;基于所述实体情感数据进行模型训练,获取实体情感分类模型;使用所述实体情感分类模型对预测文本进行实体情感分析。通过本申请,可以提高实体情感分类性能。
背景技术
随着众多互联网平台的快速兴起和不断发展,人们已习惯于在各大平台分享自己的所感所想。在众多领域中,通过对用户生成内容洞悉用户的需求与体验已经成为了众多服务商的普遍需求。作为自然语言处理领域热门应用技术之一的实体情感分析,为这一需求提供了细致且有效的解决方案。
相较于传统的情感分类技术,实体情感分类的研究对象是更为细粒度的特定实体。特定实体的情感可以为不同任务提供特征,使任务应用场景更加丰富灵活。
目前,基于BERT预训练模型的句子级情感分析方法可以获得较为先进的性能,通常考虑单一特征(实体语义特征)或是使用较为复杂的模型对某一特征进行融合,但仍然存在以下不足:
1、在实体情感分析任务上,由于未能利用更多实体相关的特征,性能并不如预期;
2、并未综合考虑实体语义信息与实体位置信息、句子语义信息和实体上下文特征之间的关联关系,单纯使用实体语义特征的模型导致模型性能低;
3、使用多特征融合的模型,特征融合方式复杂,计算开销大,性能提升不明显,模型复杂度较高。
实现思路