本技术涉及训练样本数据配比优化技术,旨在提升训练样本分类配比效率。该方法包括:收集各类训练样本数据;依据数据特征进行分类;通过算法优化样本配比;最终实现训练效果的提升。该技术包括相应的装置和存储介质,以支持该方法的实施。
背景技术
基于深度学习的多类别多任务训练方式已经在各个领域广为使用。在数据筛选时,各个类别和任务数据量的抽样配比对最终模型结果会产生极大的影响,比如某一类别或任务数据占比过大会导致其他任务和类别精度过低。
目前,在对各个类别和任务数据量的抽样配比时,有的通过数据采样时保证各个类别和任务训练数据数量相同来保证最终训练模型的精度。然而,该种实施方式,当某些类别数量过少或存在大量相似图片时多次重复采样将会产生模型过拟和。而且不同问题难度不同,这样也会导致复杂任务精度过低。
因此,为了提高训练模型的精准度,如何提出一种训练样本数据配比的确定方法成为目前亟待解决的问题。
实现思路