创新英语口语识别技术:系统、设备、介质及程序产品
2025-02-10 20:13
No.1338603721151750144
技术概要
PDF全文
本技术涉及一种创新的英语口语识别解决方案,覆盖方法、系统、设备、介质及程序产品。该技术专注于语音识别领域,通过提取音频的时间和频率特征,并运用维度变换技术,实现精准的口语识别。
背景技术
语音识别是一种将语音信号转换为文本或命令的技术,也被称为自动语音识别()。语音识别系统能够将说话者的口头语音转换为书面文本,使计算机能够理解和处理语音输入。 在深度学习技术兴起之前,语音识别主要采用传统的信号处理和模式匹配技术。模式匹配技术包括动态时间规整和隐马尔可夫模型,这些技术用于对语音信号的特征进行建模和匹配,以识别说话者的语音。 然而,传统的语音识别方法存在一些显著的缺点。首先,这类方法通常基于有限的词汇和手工设计的语法规则,限制这类方法在处理广泛的词汇和更自由的语言表达时的能力。其次,这类方法依赖手工设计的特征提取方法,如梅尔倒谱系数和线性预测编码,这些特征提取方法需要领域专业知识,且可能无法充分捕捉语音信号中的抽象特征。最后,这类方法所采用的模型如高斯混合模型和隐马尔可夫模型在捕捉复杂的语音模式和长期依赖性方面存在一定的局限性。 深度学习模型能够更好地处理复杂的语音模式、更大规模的数据集,并且对环境噪声更具鲁棒性。不过尽管基于深度学习的语音识别方法取得了显著的效果,但也仍存在着一些不足,如模型主要对音频数据的时间维度进行依赖性计算、数据量不足会导致模型的实际识别效果不佳等。 例如,在语音识别领域的一种新颖的卷积增强架构。由于能够从音频信号中同步捕获全局特征和局部特征,使得模块不仅成为任务的常用模型,而且还成为各种端到端语音处理任务的模型。但是,其大部分模型功能都分配给了时间建模,具体表现是时间维度的依赖性计算,而语音虽然是时间序列信号,但与文本数据不同的是,语音信号的特征是时频域的,因此频域也起着另一种不可或缺的作用。 另外,深度神经网络的主要驱动力是大量训练数据的可用性,但这对于语音识别来说并不总是可行的。这是因为收集大规模含有文本标签的音频数据的成本很高,特别是在口语考试场景下,大部分考生的口语发音并不标准且不统一,且音频中包含了很大一部分的静音或断断续续的片段,这很大程度上增加了转录的成本。这类质量较低的音频数据难以训练出高准确率的语音识别模型,影响识别准确率。
实现思路
阅读余下40%
技术概要为部分技术内容,查看PDF获取完整资料
该技术已申请专利,如用于商业用途,请联系技术所有人!
技术研发人员:
许信顺  郑文瑞  罗昕  陈振铎
技术所属: 山东大学
相关技术
跨语言文本中实体语义识别处理方法、系统及存储介质 跨语言文本中实体语义识别处理方法、系统及存储介质
一种高效文字转语音的方法及系统 一种高效文字转语音的方法及系统
一种用于智慧呼叫的语义识别方法及系统 一种用于智慧呼叫的语义识别方法及系统
基于分布式光纤声波传感系统的语音增强方法 基于分布式光纤声波传感系统的语音增强方法
音频处理方法、装置、电子设备及介质 音频处理方法、装置、电子设备及介质
一种定向拾音方法、装置、电子设备和存储介质 一种定向拾音方法、装置、电子设备和存储介质
语音识别系统的重打分方法、装置、电子设备和存储介质 语音识别系统的重打分方法、装置、电子设备和存储介质
一种语音辅助阅卷的声音智能识别方法及系统 一种语音辅助阅卷的声音智能识别方法及系统
基于多子带生成策略的语音合成系统、方法、介质及设备 基于多子带生成策略的语音合成系统、方法、介质及设备
一种英语口语识别方法、系统、设备、介质及程序产品 一种英语口语识别方法、系统、设备、介质及程序产品
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工
苏ICP备18062519号-5 © 2018-2025 【123技术园】 版权所有,并保留所有权利