本技术涉及一种结合失信知识图谱辅助信息的知识表示学习策略。该方法通过分析市场主体失信信息知识图谱,收集相关辅助信息,并构建知识三元组,以增强失信信息的知识表示学习效果。
背景技术
随着商业环境的不断改善,市场主体数量迅速增长,市场业态变得更加复杂和多样化,导致市场失信案件不断增加,监管任务也变得更加繁重。因此,迫切需要开展市场主体失信信息知识图谱构建及智能融合技术研究。这项研究针对数据量大、数据类型多样、功能面广、技术繁多、知识高维异构冗余等特点,旨在研制出抽取、挖掘、分析、融合、推理一体化的失信信息知识表达模型。这将为市场监管部门提供强大的支持,提升其基于信用的市场监管效能。
知识图谱(Knowledge Graph,KG)是一种使用图模型来描述知识和建模世界万物之间的关联关系的技术方法,其主要目标是用来描述真实世界中存在的各种实体和概念以及他们之间的关系,是一种以图形化的方式表示知识的工具。知识表示学习(KnowledgeRepresentation Learning)是一种被广泛采用的知识表示方法,它是对现实世界的一种抽象表达,通过将知识图谱中的实体和关系嵌入到连续向量空间,从而在方便计算的同时保留知识图谱中的结构信息。知识表示学习可以通过度量实体和关系低维嵌入的相似性来显式地捕获实体和关系之间的相似性。这种技术可以应用于许多下游任务,如知识问答、推荐系统等。
自从2012年谷歌公司利用知识图谱改善搜索体验并提高搜索质量后,知识图谱引起了社会各界纷纷关注,许多大规模的知识图谱也相继出现,如Freebase、WordNet、DBpedia和YAGO等。在近年里,学习知识图谱中实体与关系的向量表示方法变得极为流行。以TransE为代表的模型,将关系视为实体间的翻译向量,即从头部实体到尾部实体的向量。由于其简洁而有效,TransE已成为知识表示学习的典型模型。此外,在TransE的基础上,其他扩展模型如TransH、TransR、RESCAL和ANALOGY等模型在TransE的基础上进行了改进,以更好地处理不同类型的关系或提高模型的性能。
然而,现有的知识表示方法通常只关注三元组本身,在建模时忽略了三元组周围的外部辅助信息,未能充分利用这些外部信息来丰富知识表示的语义内容。知识图谱中的实体和关系通常拥有丰富的额外辅助信息,例如类型、描述、名称、逻辑规则以及视觉信息等。这些信息从多个角度对实体和关系的语义进行了刻画,是非常有价值的先验知识,通过对这些辅助信息进行建模,并嵌入表示学习模型,可以改进实体和关系的向量化表示性能,提高语义关联时的精确性。
实现思路