本技术介绍了一种利用深度学习技术实现的农业病虫害方言语音智能识别方法。该方法融合梅尔频率倒谱系数与卷积神经网络,分为预训练和再训练两个阶段。预训练阶段涉及长语音文件的录制与存储、语音信号特征提取、神经网络模型训练;再训练阶段则包括短语音文件的录制与存储、语音信号特征提取、验证测试、模型参数调整及最优模型保存。该技术考虑了不同地区口音差异,对农业监测人员方言语音信息进行智能识别,显著提升了复杂方言语音信号的识别准确率,特别是在理解农业病虫害相关术语方面。
背景技术
方言的多样性为语音识别带来了新的挑战。特别是在农业领域,若可以基于智能识别技术利用语音输入对病虫害进行描述和记录,这种方法可以极大提高病虫害管理的准确性和效率,帮助农业从业者及时做出反应,降低病虫害对作物的影响,但农业从业者在描述病虫害时往往使用地方方言和特定术语,不同地区的方言在发音、词汇和语法上存在显著差异,这使得语音识别模型在农业领域的适应性和准确性受到影响。
实现思路