本技术介绍了一种提升知识图谱几何模型表达能力的方法,应用于知识图谱表示学习算法。该方法首先确定几何知识图谱表示学习模型S和关系模式P,构建基于陷阱函数的优化框架,通过调整参数增强模型的表达能力。
背景技术
知识图谱是以图的形式描述现实世界中对象之间关联的知识库。知识图谱中的节点表示现实世界的实体,边表示实体之间的关系。通常,知识图谱可以有效地存储为三元组,每个三元组由两个实体和它们之间的一个事实关系组成。
近年来,大型知识库的构建快速增长,由于它们在存储和表示事实知识方面的有效性,已经成功应用于问答、推荐系统、信息检索和其他特定领域。
尽管知识图谱在表示结构化事实信息方面是有效的,但由于其大规模和复杂的图结构,使其难以操作。因此知识图谱表示学习被提出,以高效地提取和利用大规模知识图谱中的有用信息用于下游任务,如链路预测和实体分类。
知识图谱表示学习通过将知识图谱中的实体和关系投影到连续向量空间,训练实体和关系向量参数,使其能够学习图谱实体之间的复杂语义关联。然后,利用学习到的实体和关系嵌入来进行知识图谱补全。
在知识图谱补全中,关系模式对于推断缺失/未观察到的事实至关重要;目前,为了建模大规模知识图谱中不同的关系模式,主要是通过将关系表示为从头实体到尾实体的不同几何变换来实现。然而,为了表示这些关系模式,不同的知识图谱表示学习模型在优化的过程中往往存在训练时间长,收敛速度慢以及模型鲁棒性差等缺点。
为了增强知识图谱表示学习模型在表达关系模式的能力,通过以下两种途径实现:引入不同的几何变换来丰富模型对关系模式的表达,以及在基础的变换之上引入额外的信息。
但是这两种方法存在以下问题:
(1)通过引入不同的几何变换的知识图谱表示学习方法,针对不同的关系模式设计了不同的几何变化,如平移,旋转以及投影等,将不同关系的变换进行组合,提升了模型在表达关系模式上的能力。但从模型演化的角度,对于几何变换的强约束,模型很难演化到几何变换的最优解中,从而出现鲁棒性差,优化难的问题。
(2)通过在基础的变换之上引入额外信息的知识图谱表示学习方法,将实体的外部知识作为节点特征引入模型,同时结合关系的语义信息进行建模,这种方法虽然提高了知识图谱的表示学习效果,但是额外参数的引入也给模型带来了训练时间过长,收敛速度较慢等问题。
因此亟需一种知识图谱几何模型表达能力增强算法,能够结合上述两种方法的优点,在增强知识图谱表达能力的同时,兼顾训练高效性和泛化性的优点。
实现思路