高效特征提取技术:应用于8K至16K语音采样率
2025-02-08 21:55
No.1337904651118583808
技术概要
PDF全文
本技术介绍了一种创新的特征提取技术,适用于8K至16K采样率的语音信号。该技术的核心在于捕获高频部分的多维MFCC特征能量值,并据此判断特征值的有效性,以实现精确的特征提取。该技术可应用于多种电子设备和存储介质,为语音处理领域带来新的解决方案。
背景技术
目前主流的语音识别系统理论上是支持多种不同的采样率的语音信号,但是主流语音系统的声学模型大部分只支持8k(8000)和16k(16000)采样率两种的信号。对于外部传入不是这两种的语音的信息,往往通过一些音频转换的方法,将语音进行升采样或者是降采样。比如48k语音降采样到16k,8k语音升采样到16k等。这样做的好处可以节省系统的开销,如果不采取转换的方式,理论上需要不同采样率的率的模型来识别不同采样率的语音。另一方面,只选择一种或者两种语音做声学模型训练的方法,减少数据采集的成本,无需搜集各类采样率的语音,只需收集某类采样率的语音。但是这种方法存在问题是,当与声学模型训练数据匹配测试语音(常见16k或者8k)识别性能较好,但是与训练数据不匹配的语音时,性能相对差一些。比如,使用8k升采样到16k的语音去测试16k模型比8k模型测性能要差一些。
实现思路
阅读余下40%
技术概要为部分技术内容,查看PDF获取完整资料
该技术已申请专利,如用于商业用途,请联系技术所有人!
技术研发人员:
沈华东周雷李轶杰梁家恩
技术所属: 云知声智能科技股份有限公司.
相关技术
神经网络的训练方法、语音降噪方法、设备及存储介质 神经网络的训练方法、语音降噪方法、设备及存储介质
跨语言文本中实体语义识别处理方法、系统及存储介质 跨语言文本中实体语义识别处理方法、系统及存储介质
一种高效文字转语音的方法及系统 一种高效文字转语音的方法及系统
一种用于智慧呼叫的语义识别方法及系统 一种用于智慧呼叫的语义识别方法及系统
基于分布式光纤声波传感系统的语音增强方法 基于分布式光纤声波传感系统的语音增强方法
音频处理方法、装置、电子设备及介质 音频处理方法、装置、电子设备及介质
一种定向拾音方法、装置、电子设备和存储介质 一种定向拾音方法、装置、电子设备和存储介质
语音识别系统的重打分方法、装置、电子设备和存储介质 语音识别系统的重打分方法、装置、电子设备和存储介质
一种语音辅助阅卷的声音智能识别方法及系统 一种语音辅助阅卷的声音智能识别方法及系统
基于多子带生成策略的语音合成系统、方法、介质及设备 基于多子带生成策略的语音合成系统、方法、介质及设备
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工
苏ICP备18062519号-5 © 2018-2025 【123技术园】 版权所有,并保留所有权利