异构知识图谱实体匹配技术
2025-02-21 16:08
No.1342528345094758400
技术概要
PDF全文
本技术介绍了一种异构知识图谱实体匹配技术,该技术属于知识图谱领域。主要步骤包括:获取并处理两个异构知识图谱数据;运用预训练的大型语言模型提取知识图谱信息;通过相似度计算实现实体对齐。
背景技术
近年来,涌现出一大批知识图谱(knowledge graph,KG),诸如YAGO、Dbpedia、NELL等。这些大规模知识图谱在问答系统、个性化推荐等智能服务中起到重要作用。此外,为满足特定领域相关需求,衍生出越来越多的领域知识图谱,如医疗知识图谱。在知识图谱构建过程中,无法避免地需要在覆盖率和正确率间作权衡。而任何一个知识图谱,都无法达到完备或者完全正确。 为提升知识图谱的覆盖率及正确率,一种可行方法是从其它知识图谱中引入相关知识,因为以不同方式构建得到的知识图谱间存在知识的冗余以及互补。例如,从网页上抽取构建的通用知识图谱中可能仅包含药品的名字,而更多的信息可在基于医疗数据构建的医疗知识图谱中找到。为将外部知识图谱中的知识整合到目标知识图谱中,最重要的一步是对齐不同的知识图谱。为此,实体对齐(entity alignment,EA)任务被提出并受到广泛关注。该任务旨在找到不同知识图谱中表达同一含义的实体对。而这些实体对则作为链接不同知识图谱的枢纽,服务于后续任务。 目前,主流实体对齐方法主要借助知识图谱结构特征判断两实体是否指向同一事物。这类方法假设不同知识图谱中表达同一含义的实体具有类似的邻接信息。在人工构建的数据集上,这类方法取得了最好的实验结果。但这些人工构建的数据集中的知识图谱比真实世界的知识图谱更加稠密,而基于结构特征的实体对齐方法在具有正常分布的知识图谱上效果大打折扣。 事实上,通过分析真实世界知识图谱中的实体分布可知,超过半数的实体只与一两个其它实体相连。这些实体被称为长尾实体(long-tail entities),占据了知识图谱实体的大部分,使得图谱整体呈现较高的稀疏性。这也符合对真实世界知识图谱的认知:只有很少一部分实体被经常使用并具有丰富的邻接信息;绝大部分实体很少被提及,包含微少的结构信息。因此,当前基于结构信息的实体对齐方法在真实世界数据集上的表现不尽人意。
实现思路
阅读余下40%
技术概要为部分技术内容,查看PDF获取完整资料
该技术已申请专利,如用于商业用途,请联系技术所有人!
技术研发人员:
肖力军  邹雯欣  奉双波  梁伟  黄晶  尹路修  陈少淼
技术所属: 湖南科技大学
相关技术
一种基于属性感知的Web网页信息抽取方法及装置 一种基于属性感知的Web网页信息抽取方法及装置
一种场景问答模型生成方法及装置 一种场景问答模型生成方法及装置
社交媒体特征数据的预估方法及装置 社交媒体特征数据的预估方法及装置
一种基于数字孪生的双向DC/DC变换器状态监测方法 一种基于数字孪生的双向DC/DC变换器状态监测方法
基于模仿学习的驾驶培训教学方法及系统 基于模仿学习的驾驶培训教学方法及系统
一种多参与方监理数据管理方法 一种多参与方监理数据管理方法
风电低出力事件判别及功率预测模型训练方法及装置 风电低出力事件判别及功率预测模型训练方法及装置
一种基于贪心策略的抗社交网络用户身份关联方法 一种基于贪心策略的抗社交网络用户身份关联方法
直流变换器故障诊断方法、装置、设备、介质及程序产品 直流变换器故障诊断方法、装置、设备、介质及程序产品
一种商业秘密保护泄密点分析的方法 一种商业秘密保护泄密点分析的方法
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工
苏ICP备18062519号-5 © 2018-2025 【123技术园】 版权所有,并保留所有权利