本技术涉及一种高效的降噪模型训练技术,包括降噪方法、装置和存储介质。该技术通过将带噪语音数据输入降噪模型,利用编码器和第一解码器进行处理,输出降噪后的语音数据,以提升语音质量。
背景技术
语音降噪方法主要分为两大类,一种是基于传统统计信号处理的方法,这类方法对于平稳噪声(比如:白噪声等)具有很好的效果,且算法可控,稳定性高,但是对于非平稳的突发噪声,降噪效果较差,虽然可控性和稳定性较好,但在真实应用场景下效果通常低于预期;另一种语音降噪方法是基于神经网络的有监督回归训练方法,随着模型的复杂和硬件算力的提高,降噪效果越来越难以优化和提升,而且一些语音中的发音音素在信号层面的特征近似于噪声,很难通过网络学习进行区分和解决,导致降噪后语音严重失真。
实现思路