本技术公开了一种快速语音语义识别技术,包括方法、系统、电子设备和存储介质。该技术通过监测设备待唤醒状态,捕获唤醒词,并据此判断是否激活设备。该方法能够提高语音识别的效率和准确性,适用于智能设备和语音交互系统。
背景技术
专利WO2020024885A1虽然解决的问题与本专利申请类似,但是他们主要是通过上一句语音指令进行语速分析和断句节点的动态设置。该方案的最大缺陷在于实际应用场景中,无法保证上一句语音指令与当前语音指令为同一用户发出,且同一个人说的两句话也可能不是同一个语速,因此上一句的语速并不能直接作为当前语音交互时的判断依据。
语音交互场景下,由于每个用户语速习惯不一样,甚至同一用户在不同情绪下的语速情况都不一样。因此,传统的通过设置停顿时间阈值的方式如判断长语音中间的停顿长度是否大于预设阈值,如果停顿长度大于预设阈值,则可以对语音进行断句的处理,采用上述方法对语音进行断句的效果并不佳,由于人在说话的时候语速是不固定的,因此,以停顿长度是否大于预设阈值作为断句的依据,可能会导致出现频繁断句或者长时间不断句的问题,由此,降低了断句的准确度。
实现思路