本技术属于成矿预测技术领域,公开了一种精细样本分割和小样本学习策略的成矿预测方法。本发明提出一个鲁棒的小样本学习框架,通过数据增强扩充了有标签数据的容量,并采用迁移学习对模型预训练和微调,使模型具有出色的预测效率,在一定程度上抑制了模型的过拟合问题,降低了模型预测的不确定性。小样本学习框架经过SMOTE对数据集平衡化,提高了数据集在训练过程中的分类精度。小样本学习框架的预测点呈拱形,有利于对高概率、低不确定性的潜在目标进行聚焦。小样本学习框架有控制过拟合的能力,并产生了具有低不确定性水平的高置信度勘探目标。
背景技术
监督学习的数据驱动的成矿预测是一个典型的小样本任务,受到有标签数据的缺乏、模型的过拟合和预测的不确定性的影响。小样本学习技术能够通过合成少数过采样技术(SMOTE)的数据增强技术来扩大标记数据的数量,且能够将从大量数据中学习的知识转移到目标的稀缺数据中。因此,提出一个鲁棒的小样本学习框架能够有效解决基于监督学习的数据驱动的成矿预测任务中存在的问题。
基于监督学习的数据驱动的成矿预测面临着三大挑战。首先,模型的训练依赖于一个由大量正样本和负样本组成的有标签数据集;其次,精细的机器学习模型在数据稀缺和数据集不平衡的成矿预测任务中会表现出过拟合现象,在成矿预测的任何案例研究中,非矿点(负样本)的数量大大超过矿点(正样本),这就导致了严重的数据集不平衡;此外,由于对矿物系统理解的不完全、在勘探和测量中出现的偏差,以及在训练和应用机器学习模型时固有的和随机的误差,使得预测结果具有不确定性。
通过上述分析,现有技术存在的问题及缺陷为:
监督学习的数据驱动的成矿预测是一个典型的小样本任务,受到有标签数据的缺乏、模型的过拟合和预测的不确定性的影响。
实现思路