本技术介绍了一种结合知识图谱和表示学习的滑坡空间预测方法。该方法包括:步骤S1,构建包含机理知识和时空特征的滑坡易发性知识图谱;步骤S2,设计知识图谱本体模式,实现对时空因素的综合考量;步骤S3,通过表示学习技术提取特征,提高预测准确性。
背景技术
现有研究表明,滑坡受多种要素的耦合关联影响,形成位置隐蔽、孕灾条件不清,复杂异质的地理环境促进多样化滑坡特征的形成。为提高滑坡风险管控水平,亟需探索滑坡复杂的成灾机制,掌握多样化滑坡特征,提高县级尺度滑坡空间预测能力,确定滑坡易发区位置,在此基础上开展科学监测预警和主动防范,避免灾难性灾害事件的发生。
滑坡空间预测旨在评估特定区域内滑坡发生的可能性。当前国内外的研究主要分为知识驱动和数据驱动两种方法。知识驱动的力学机理模型虽然能够实现较为精确的模拟,但依赖高精度的地质数据,参数获取困难,适用单体范围内的确定性预测;经验规则方法是根据领域专家知识选择全面、典型的影响条件因素并确定权重,进行叠加分析,操作简单,不依赖数据样本,但主观性强,专家经验分散,没有充分考虑灾害机理和滑坡发生之间的非线性关系。数据驱动的方法通过利用影响条件要素和历史滑坡数据建立预测模型,更适用区域范围内非确定性的滑坡空间预测,是当前研究主流。例如随机森林、支持向量机、人工神经网络等,通过将滑坡影响条件要素作为预测变量,将已知滑坡作为标签,利用大量历史数据进行训练,在简单的滑坡场景中表现出更高的预测精度。但仅仅基于数据的预测方法仍没有充分考虑滑坡复杂成灾机理,忽视了影响条件要素之间的相互关联,例如地形地貌条件影响植被覆盖程度和土壤水分变化这类明确关系,或是人类活动对滑坡发育的潜在影响关系,导致对复杂滑坡场景知识建模不充分。同时,忽略空间距离上较远的预测单元之间的有效关联,仅仅考虑预测单元局部范围的滑坡及其地理环境特征,限制了模型在复杂异质环境下的特征提取与表示的能力。此外,模型依赖大量高质量滑坡样本数据,然而县级尺度滑坡样本量有限,传统基于随机抽样或缓冲区控制抽样方法生成的非滑坡样本往往可能位于容易发生滑坡的陡坡上,具有较高不确定性,进一步限制了模型学习多样化滑坡和非滑坡特征的能力。
知识图谱技术的引入可以有效建模复杂机理知识,整合多源异构数据信息,发现数据、知识之间的相关性、依赖性,提高复杂滑坡场景下的空间预测结果的准确性。如Ge等综合遥感影像数据、地理要素信息和领域专家知识等构建滑坡灾害知识图谱,将历史滑坡灾害与DEM数据的拟合模型转化为语义推理规则,实现了基于规则推理的滑坡空间预测。Chen等利用预测单元列表、滑坡灾害历史数据、环境数据以增强复杂滑坡场景的表示,通过训练知识图谱表示学习模型(KRL)捕获知识图谱中的语义信息,基于链路预测算法实现稀疏滑坡样本下的滑坡易发性制图。然而,现有知识图谱在滑坡空间预测任务中的相关研究仍大多局限在基于人工定义规则的知识推理,灵活性差;基于KRL模型的链接预测仅仅侧重于对知识图谱的局部结构特征的学习,缺乏对图结构特征的深度学习。受县级尺度有限滑坡样本数量和多样化滑坡特征等影响,模型的特征提取和表示能力受限,而知识图谱的图结构,通过利用节点和边可以建立起不同空间距离下相似及相邻区域特征的有效关联,在此基础上,引入图神经网络,通过定义遍历图的深度,可以提取出更加深度的图结构特征,提高复杂异质环境下对多样化滑坡和非滑坡特征的归纳学习能力。
综上,现有技术存在的主要缺点包括:
(1)现有知识驱动的方法,存在参数获取困难,影响条件要素的选择及其权重的确定依赖专家经验等问题,同时没有充分考虑到滑坡变形破坏的过程是地形、地质、气象等多因素耦合作用下发展演化的非线性动力系统。
(2)现有数据驱动的方法,没有充分考虑各类影响条件要素之间的有效关联,对复杂的滑坡场景知识建模不足,局限于预测单元局部范围内的滑坡及其地理环境特征;此外,县域范围内滑坡样本数量有限、传统抽样方法获取的非滑坡样本不确定较高的,模型易出现过拟合或者欠拟合现象。
(3)现有基于知识图谱进行滑坡空间预测的方法,局限在基于人工定义规则的知识推理,灵活性不足,基于KRL模型的链接预测方法仍缺乏对图结构特征的深度学习。
对此,本发明旨在提出一种基于知识图谱和表示学习的滑坡空间预测方法,建模复杂机理知识,整合多源数据,以进一步学习数据、知识之间的有效关联。
实现思路