全范围零吸引LMS算法在自适应滤波技术中的应用 全范围零吸引LMS算法在自适应滤波技术中的应用
本技术涉及一种基于全范围零吸引LMS算法的自适应滤波方法,属于数字信号处理领域。该方法包括:建立回声消除器系统模型;通过拾音设备采集若干组音频信号,构建信号矩阵,并引入信道噪声;将音频信号输入自适应滤波器中处理输出得到回声信号;将音频信号输入回声信道,并将回声信道的输出信号与信道噪声叠加获得期望信号;计算期望信号与回声信号之间的误差,并将其输入至自适应滤波器中对自适应滤波器的系数进行迭代更新,获得最优滤波参数;在最优滤波参数下,从获取的实时语音信号的期望信号中去除自适应滤波器产生的回声信号后,得到滤波处理后的语音信号。本发明有利于提高回声消除器的性能和稳定性,同时对算法的参数选择更具鲁棒性。
英语口语情感分析技术 英语口语情感分析技术
本技术提供一种英语口语情感诊断方法,该方法是一个由顺序连接的英语口语预处理模块、英语口语情感诊断模块组成的诊断方法。英语口语通过该诊断方法处理后,最后能够得到这条英语口语的情感诊断结果。本发明能够解决现有的英语口语情感诊断方法存在的情感诊断信度与效度差的问题。
智能语音控制技术:车载系统与设备 智能语音控制技术:车载系统与设备
本文公开了一种控制方法、装置、车载终端、车辆和存储介质。该控制方法包括:接收从客户端输入的第一语音控制指令;根据所述第一语音控制指令,确定发出所述第一语音控制指令的第一声源位置;在确定所述第一语音控制指令为第二语音控制指令的跟随指令,且所述第一声源位置与第二声源位置不相同的情况下,根据所述第一语音控制指令控制所述第一声源位置处的第一控制对象,所述第一控制对象为与所述第二语音控制指令中的第二控制对象是相同类型的对象;其中,所述第二声源位置为发出所述第二语音控制指令的声源所在的位置。采用本申请提供的控制方法,可以提高驾乘人员对之前操作过的同种类型的控制对象的二次操作的智能性、简便性和高效性。
带式输送机异常声音识别技术 带式输送机异常声音识别技术
本技术公开一种用于带式输送机故障诊断的异常声音检测方法,包括:构建训练集;所述训练集包括:正常声音和异常声音;利用所述训练集对预设的带式输送机故障诊断声音异常检测网络进行训练。预设的带式输送机故障诊断的声音异常检测方法主要包括:对数梅尔频谱图模块、谱时特征融合模块、基于流的自监督估计模块;将所述的带式输送机在嘈杂环境下的运行声音提取有效特征并进行故障诊断,判断是否发生故障以及发生故障类型。本发明在基于流的自监督密度估计模块上融合了对数梅尔频谱图模块以及谱时特征融合模块,实现了多尺度的特征融合,丰富了提取的特征,并取得极好的带式输送机故障诊断的异常声音检测效果。
多模态语音情感分析:预训练模型应用与系统构建 多模态语音情感分析:预训练模型应用与系统构建
本技术提供了一种基于预训练模型的多模态语音情感识别方法,包括如下步骤:步骤1、获取数据集,所述数据集中包括若干数据对,所述数据对包括相对应的文本的数据和音频数据,每个所述数据对设置有情感标签;步骤2、从文本数据中获取文本语义特征,从同一数据对中的音频数据获取音频声学特征和语音情感特征;步骤3、将文本语义特征、音频声学特征和语音情感特征进行特征融合,获得融合特征;步骤4、将融合特征输入至线性分类器当中,通过softmax层后将其输出作为每一种情感的得分,取得分最大值对应的情感标签所对应的情感作为识别结果。该方法并基于注意力机制提出了一种以语音情感为导向的融合策略,显著提高了语音情感的预测准确率。
语音识别测试系统:模拟不同距离识别效果 语音识别测试系统:模拟不同距离识别效果
本技术公开了一种模拟不同距离的语音识别成功率的测试系统及方法。本发明模拟不同距离的语音识别成功率的测试系统,包括:校准模块,用于校准以固定的发音源响度在不同距离的语音识别成功率;测试模块,用于根据在不同距离的语音识别成功率分别获得在固定距离的发音源的不同响度;模拟模块,用于根据得到的在固定距离发音源的不同响度,对应模拟固定发音源响度在不同距离的语音识别成功率。本发明在固定的位置改变发音源的响度,模拟不同距离的语音识别成功率,解决了现有技术中测试过程受空间限制的问题。
轨道声学信号降噪声学技术与设备 轨道声学信号降噪声学技术与设备
本文公开了一种轨道声学信号降噪方法及装置,涉及轨道交通技术领域,采用短时傅里叶变换处理轨道声学信号,得到包括不同时刻中每一时刻对应的轨道声学信号的全频带能量值,计算每一时刻波磨特征频带的能量和在同一时刻轨道声学信号的全频带能量和的占比。本申请将该波磨信号常见频带的能量和在同一时刻轨道声学信号全频带能量和的占比,作为行车‑轨道所激励的声学信号权重以降低无关噪声,能够有效避免数字滤波器、小波阈值降噪等方法导致声纹特征丢失的缺陷,也能够有效避免传统谱减法采用参考噪声降噪时产生的‘音乐噪声’的缺陷,能在保证不丢失轨道声学信号声纹特征的前提下,达到降噪以突显轨道波磨特征的目的。
创新语音降噪技术:复合式对抗增强网络的应用 创新语音降噪技术:复合式对抗增强网络的应用
本文提出一种语音增强方法、装置、设备及存储介质,该方法包括:将带噪语音输入预先训练的复合式对抗增强网络模型,得到所述复合式对抗增强网络模型输出的语音增强结果,所述语音增强结果中至少包括增强语音;其中,所述复合式对抗增强网络模型对带噪语音进行语音增强处理得到的增强语音的声纹特征,接近于与带噪语音对应的干净语音的声纹特征。上述方法可以在对带噪语音进行语音增强的同时,降低语音增强造成的语音失真。
创新的声音复制技术与系统 创新的声音复制技术与系统
本技术提供了一种声音复刻的方法和系统,所述方法包括S1、预训练说话人编码器:准备一说话人编码器,并对其进行预训练;S2、预训练语音合成模型:准备一语音合成模型,并对其进行预训练;S3、音频采集:向用户提供包含有若干文字量的示例文本,并采集用户诵读示例文本的示例音频;S4、训练合成器:对合成器进行微调训练;训练完成后的合成器与声码器组合形成的语音合成模型用于实现特定用户的语音复刻。本发明能够快速地利用极少量的样本,实现用户的声音复刻和语音合成,可广泛应用于有声阅读、智能客服、智能车载等领域。
声纹特征识别系统:通话风险评估 声纹特征识别系统:通话风险评估
本技术涉及声纹识别领域,且公开了基于声纹特征识别实现通话相关风险性判断系统及方法,包括以下步骤:Step1:对通话音频进行记录监控,并上传至数据库;Step2:对双通道音频进行通道分离,提取用户侧通话;Step3:通过智能去静音手段,去除静音音频片段,将其他有效音频重新合并为新音频;Step4:通过人工智能深度学习算法,在训练好的模型上,提取用户通话音频的声纹特征;Step5:将通话音频上传至数据库。该发明可提升声纹特征识别过程中的效率,及时监控发现通话过程中的风险,能够对有疑问的数据进行二次人工核验,提升判断的准确性,能够对同一用户的声纹数据进行不断比对避免出现误判。
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工