本技术涉及机器学习领域,提供了一种语音速率识别技术、系统、设备及存储介质。该技术包括:收集至少两帧的语音数据;分析这些语音帧的基音周期状态;构建基于机器学习的模型来识别语音速率;以及将识别结果应用于相关设备和存储介质。
背景技术
语速是人类表达语言符号时在单位时间内所呈现词汇的速度,通常,语速 与人类特定的说话习惯、心情以及环境相关,语速过快会导致收听者的收听效 果较差,而语速过慢会导致收听者需要耗费较多时间进行收听。
相关技术中,基于自动语音识别技术(Automatic Speech Recognition,ASR) 技术对指定语音信号进行语速识别,也即,将指定语音信号通过ASR技术识别 得到文本内容,并确定文本内容对应指定语音信号的语音时长,从而以语音时 长和文本内容的内容长度确定语速。
然而,该过程中ASR技术的识别准确率受说话环境噪声的影响较大,且不 同人的发音习惯不同,对识别率也存在一定的影响,导致在文本内容识别结果 错误的情况下,语速计算结果的准确率也较低。
实现思路