本技术属于语音技术领域,特别是一种用于辅助阅卷的智能语音识别方法和系统。该系统通过采集阅卷过程中的语音信号,并分析其基音周期谱图的连通域,实现对语音数据的智能识别和处理。
背景技术
教师在对学生的作业进行网上阅卷时,可以通过语音识别系统,直接使用语音给出评语和建议,系统会将这些语音转换成文字,供学生查看,但是教师在给出评语时可能会有停顿或包含非语言声音,而端点检测算法可以帮助系统更准确地识别教师说话的开始和结束,避免将教师的思考时间或无关的背景声音作为有效语音输入而影响语音识别的结果。
双门限端点检测算法是现在常用的一种端点检测算法,该算法相对简单,易于实现,计算量不大,适合实时系统,但是该算法的性能在很大程度上依赖于门限参数的选择,而不同教师的说话习惯,如语速、停顿频率的不同,使得难以确定和调整该算法中门限参数的取值,而门限参数的取值不当可能会导致语音信号中的有声段语音信号被误判为无声段而造成有用信息的丢失,进而影响最终语音识别的结果。
实现思路