本申请提供了一种面向无监督图神经网络的对比学习方法和装置,通过对待训练的第一图神经网络模型输出的最终嵌入表示进行聚类,得到聚类标签,并根据聚类概率和聚类标签生成正负样本对,从而根据正负样本对构建对比损失值,最终根据对比损失值调整第一图神经网络模型的模型参数,得到目标图神经网络模型,可以在一定程度上减少第一正样本对和第一负样本对中出现假性正负样本对的情况,从而可以在一定程度上减弱假性正负样本对在第一图神经网络模型训练过程中的影响,提升第一图神经网络模型的对比学习准确率,一定程度上提升了最终得到的目标图神经网络的预测准确率。
背景技术
图数据分析是让计算机模拟人类大脑对图数据进行处理、分析和理解,挖掘隐藏在图数据背后的语义信息,以进一步对目标节点、目标连接或全图的特性展开研究。随着深度学习技术的不断进步,基于图神经网络模型的图挖掘分析技术也被广泛应用于个性化推荐、金融风控、攻击溯源、药物研制等领域。但是,大多数图数据标注的准确性都比较低,从而对图神经网络模型的性能造成一定限制。
相关技术中,可以通过图对比学习(Graph contrast learning,GCL)的方法,以拉近正样本对的表示和拉开负样本对的表示为训练目标,从无标注的图数据中学习通用特征,并通过生成的正负样本对之间的对比损失来优化模型,以解决图数据的标注准确率较低的问题,并提升图神经网络模型的性能。
但是,通过上述方法训练得到的图神经网络模型在实际使用时仍然会出现错误,图神经网络模型的预测准确率仍然不高。
实现思路