本技术的实施例提供了一种语音识别模型的语料扩充方法、装置、电子设备及计算机可读存储介质,方法包括:获取语音识别模型中的正确文本和错误文本;对正确文本进行分词,得到多个正确词汇,将错误文本进行分词得到多个错误词汇;针对每个错误词汇,确定语音识别模型将正确词汇替换为该错误词汇的第一次数以及该错误词汇在错误文本中出现的第二次数;确定错误词汇对应的错误文本的成句的第一概率和正确词汇对应的正确文本的成句的第二概率;确定正确词汇替换为错误词汇的概率;在正确词汇替换为错误词汇的概率大于预设概率阈值时,将错误词汇添加至语音识别模型的语料中。无需进行人工对语料进行识别并扩充,节约成本。
背景技术
随着人工智能的不断发展,数据量的不断增多,自然语言处理技术在各行各业得到了广泛应用,其中一个重要应用领域即为人机对话领域。
人机对话系统,一般由语音识别模型、对话管理模块及语音合成模块构成。其中语音识别模型负责将声音转化为文字,对话管理模块负责识别其中的含义,并给出相应的回复,语音合成模块负责将回复的文字转化为语音。通常对话管理模块,是基于一些预先标注过的语料,训练自然语言处理技术算法模型,并使用该模型对语音识别结果进行用户意图的识别,并决策下一步的回复。
由于环境噪声、方言、信道等各种音素的影响,语音识别模型识别的结果中往往含有各种错误,会影响到对话管理模块中的自然语言处理技术算法准确率,从而影响交互体验。
因而,在实践中,需要增加大量的语料,对整个语音识别系统进行重新训练,而目前语料的筛选需要基于人工观察,因此,高成本的高资源损耗成为了语料获取的难题之一。
实现思路