本技术提出了一种基于改进卷积神经网络的天珠图像自动识别方法和系统,采集和预处理不同图纹、形状的天珠图像,并对天珠图像进行数据增广操作,建立天珠图像识别模型所需的训练集、验证集和测试集;构建基于改进EfficientNetV2的卷积神经网络模型,引入新的激活函数和注意力机制,批量加载训练和验证集进行迭代训练验证模型,不断调整网络参数获得最优天珠图像识别模型;输入测试天珠图像到最优模型返回天珠图像自动识别结果;本发明提出的方法能够在减少计算参数的前提下提升天珠图像识别的准确率和推理速度,可以搭建轻量化模型应用,解决传统人工识别存在准确率低、耗时耗力等问题,能够实现天珠图像的快速、准确识别。
背景技术
天珠是一种特殊的珠宝,主要由腐蚀玛瑙制成,其形状包括长型珠、短型珠、圆型珠和扁型珠,具有复杂多样的图纹。这些图纹不仅体现了不同的寓意和价值,还吸引了众多天珠爱好者和领域专家的关注。天珠的图纹特征是其图像识别的主要依据。然而,传统的天珠识别方法主要依赖人工观察和辨识,这种方式不仅费时费力,而且效率低下,识别准确率常常受到辨识人员主观经验的影响。此外,天珠的年代、材质和颜色差异进一步增加了识别的复杂性和难度。
随着深度学习技术的快速发展,基于卷积神经网络的图像分类任务的性能得到了显著提升,并已成功应用于多个领域的图像识别。深度学习方法在图像分类和识别方面的效果远超传统的人工鉴别技术,其优势在于不需要依赖专家的主观经验和人工设计特征。通过将领域图像输入深度学习模型,模型能够自动进行预处理和特征提取,并返回图像所属分类的标签。
基于深度学习的图像分类识别的一般步骤包括:首先,构建图像分类数据集,并将其按一定比例划分为训练集、验证集和测试集;其次,将训练验证图像数据集输入模型中进行迭代训练,不断优化模型以提取不同类别图像的显著性特征,并调整模型的超参数,以获得最优的图像分类模型并进行保存;最后,输入测试集至最优模型,返回预测的类别结果,以评估图像分类模型的性能。
近年来,基于深度学习的图像分类方法取得了突破性的发展,尤其是在卷积神经网络领域。自2012年卷积神经网络AlexNet在ImageNet图像识别挑战赛中表现优异以来,GoogleNet、ResNet和DenseNet等基于深度网络的模型相继提出,这些模型通过加深网络层数获得了更好的拟合能力和分类效果。然而,随着网络层数的增加,模型的参数计算量也随之加大,推理速度减慢,从而影响了模型在实际应用中的效率。
为了应对这一问题,研究人员借鉴各自的优势,提出了轻量化的深度神经网络,如MobileNet、ShuffleNet、EfficientNet和Vision Transformer等。这些模型在降低参数计算量的同时,能够提升图像分类性能。其中,EfficientNetV2在设计中融入了自适应正则化策略,其在ImageNet和CIFAR等大规模图像数据集上的验证结果显示,相较于其他模型,准确率提升了2%,训练速度加快了5至11倍,计算参数量减少了6.8倍,为图像分类模型的轻量化部署提供了良好基础。为此,本发明针对EfficientNetV2基础模型进一步改进优化,以满足快速、准确的天珠图像自动识别模型应用需求,设计一种更为轻量化的天珠识别模型,通过模型改进引入新的Hardswish激活函数和CAA注意力机制,实现减少计算量的条件下,提升识别模型的准确率和推理速度,有效解决目前传统天珠人工鉴别存在工作效率低、成本高和准确率依赖鉴别专家主观经验的问题,可以实现模型的轻量化部署应用和推广,对传统天珠鉴别提供高效地智能辅助作用。
实现思路