多模态命名实体识别技术:多粒度特征增强方法
2025-02-14 14:31
No.1339967300866154496
技术概要
PDF全文
本技术介绍了一种创新的多模态命名实体识别技术,该技术通过多粒度特征增强实现。方法首先对输入数据执行单模态特征提取,随后利用这些特征进行多模态多粒度特征的交互处理,以提高命名实体识别的准确性和效率。
背景技术
社交媒体成为人们分享日常、表达观点的主要途径,发帖量也随之增加。这种图文结合的表现方式使得用户表达更具准确度、趣味性、多元性,更好地反映出用户的需求、情感,同时也为自然语言处理(NLP)提供了大量丰富的原始语料数据。命名实体识别(NER)作为许多信息提取任务的前奏,旨在从原始文本数据中发现多个类别的命名实体,例如人员(PER)、位置(LOC)和组织(ORG)。目前基于文本的NER方法在格式良好的文本上有很好的性能,如新闻报道文本等,借助CNN、LSTM和Transformer学习上下文,通过softmax和CRF用于解码。但是社交媒体文本往往包含非正式、口语化的表达,甚至错别字、拼写错误,同时短文本包含较少的上下文信息,这样的文本内容导致数据稀疏,影响准确性。多模态命名实体识别(MNER)的提出关注到相关图片中的视觉特征,借助视觉信息增强语言特征来获得比NER更好的结果,主要是使用整个图片对每个单词编码,或者是用文本向量与视觉对象特征建立对齐。 尽管如此,多模态命名实体识别依旧重视文本内容,非正式的表达、缺少上下文依旧是需要克服是挑战;另外,全图可能存在大量无关紧要的信息,这对实体提取存在一定的干扰,因此不能只关注到整图的视觉特征而忽略了图像中的对象对于文本中单词的语义对应关系。因此急需一种多模态命名实体识别方法解决上诉问题,并进一步提高多模态命名实体识别在社交媒体帖子上的准确性。
实现思路
阅读余下40%
技术概要为部分技术内容,查看PDF获取完整资料
该技术已申请专利,如用于商业用途,请联系技术所有人!
技术研发人员:
张鹏  郭雨  曾港艳  秦绪功  张可欣
技术所属: 南京理工大学
相关技术
基于同调映射三维形状估计的虚拟课堂教学实现方法、系统、介质及设备 基于同调映射三维形状估计的虚拟课堂教学实现方法、系统、介质及设备
一种电压调理电路 一种电压调理电路
一种应用于智慧康养的咨询对话语义处理方法及系统 一种应用于智慧康养的咨询对话语义处理方法及系统
一种基极补偿加高阶补偿的无运放带隙基准电压电路 一种基极补偿加高阶补偿的无运放带隙基准电压电路
一种基于动态变分模态分解的多变量多步径流预测方法 一种基于动态变分模态分解的多变量多步径流预测方法
一种应用于智慧康养的用户画像生成方法及系统 一种应用于智慧康养的用户画像生成方法及系统
一种神经网络模型的构建方法、装置、设备及存储介质 一种神经网络模型的构建方法、装置、设备及存储介质
一种数据信息标签的辐射扫描方法、系统及介质 一种数据信息标签的辐射扫描方法、系统及介质
资源管理方法、装置和存储介质及电子设备 资源管理方法、装置和存储介质及电子设备
考虑空气湿度的转换功率预测方法及系统 考虑空气湿度的转换功率预测方法及系统
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工
苏ICP备18062519号-5 © 2018-2025 【123技术园】 版权所有,并保留所有权利