本技术涉及一种图像识别模型训练与识别技术。该技术包括记录样本图片的第一图像矩阵,随后进行切分和打乱以获得第二图像矩阵。利用卷积神经网络对图像矩阵进行处理,实现高效准确的图像识别。
背景技术
细粒度识别也叫精细识别。它与现有的通用图像分析任务不同,细粒度图像识别所需识别的种类更加细致,识别的粒度也更为精细,需要在一个大类中区分出更加细分的子类,对存在细微差别的物体进行区分和识别。
例如,通用图像分类只需要区分出“鸟”和“花”这两个物体大类,而细粒度图像分类则要求对“花”该类类别下细粒度的子类进行区分,即区分出是“月季花”还是“玫瑰花”。因此,细粒度图像识别要求找出同类别物种的不同子类之间的细微差异,因此,使得它的难度和挑战大大增加。
目前来说,细粒度图像识别在生活和工业上都有很广泛的应用场景,它作为一项图像识别技术,是人工智能领域不可或缺的一门重要技术。同时,由于它所区分的粒度更加细致,使得细粒度图像识别技术能大幅度提升现有的识别技术,帮助提高相关上层技术精度。
现有的细粒度分类模型,按照其采用的监督信息的强弱,可分为两大类:分别是“基于强监督信息的分类模型”和“基于弱监督信息的分类模型”。
其中,基于强监督信息的分类模型在训练的过程中引入了两种额外的人工标注信息,分别是目标标注框和关键部位标注点。对于这两种额外信息,强监督分类模型可以借助目标标注框得到前景对象的检测,排除背景所带来的噪声干扰;而关键部位标注点则可以被用来定位目标具有显著区别的关键点,在这些关键点上就可以高效率地提取出图片的局部特征。因此,通过这两种额外信息所提供的定位,强监督分类模型可以更好地在精准的地方提取出物体信息,排除图片背景和其他物体上无关信息所带来的干扰,得到较高的准确度,达到比较好的效果。
而基于弱监督信息的分类模型则相反,它不使用任何额外的人工标注信息,仅仅靠图片和图片的分类标签完成整个算法的训练和学习。这种类型的算法不需要大量人工的投入,在实际应用场景上更为方便简洁。总体来说,基于弱监督信息的分类模型算法的准确度不及基于强监督信息的分类模型算法。但得益于近年来深度学习的发展,基于弱监督信息的分类模型算法引入卷积神经网络来进行训练,其精确度得到了较大的提高,并逐渐成为细粒度图像识别研究的趋势。
细粒度识别算法的关键点在于如何挖掘出图片中的细微差别,即局部特征的提取。由于难以找到鉴别性特征,细粒度识别这项任务十分具有挑战性。而对于弱监督类型的细粒度识别算法来说,无法借助人工标注信息准确定位目标位置和关键部位点,只能在图片的基础上进行局部特征的提取。而对于一张图片,提取出来的局部特征非常多,如何在众多的局部特征中排除错误干扰特征,学习到有用的特征,这是一个难题。现有的局部特征提取通常使用枚举的方法,在全图使用不同的步长或尺度截取出部件区域,再对部件区域提出特征。但这种方法十分耗时,而且容易受到背景信息的干扰而提取出大量对识别无用的区域特征。另外,图片不同的光照情况、不当的拍摄角度也会对弱监督类型的细粒度识别造成干扰。在这些情况下,弱监督类型的细粒度识别的准确度较低,且鲁棒性较差。因此,弱监督类型的细粒度识别要实现较好的鲁棒性和较高的识别率仍有较大的挑战性。
实现思路