高效降噪模型训练技术及应用 高效降噪模型训练技术及应用
本文公开了一种降噪模型的训练方法、降噪方法、装置和存储介质,该方法包括:将带噪语音数据输入到降噪模型中,得到降噪后的语音数据;降噪模型包括编码器与第一解码器,降噪模型的训练方法包括:获取多个训练样本;基于编码器对样本带噪语音数据进行处理,得到第一样本特征数据;将第一样本特征数据输入第一解码器,得到估计语音数据;将第一样本特征数据输入第二解码器,得到估计文本数据;基于估计语音数据与第一样本干净语音数据之间的损失以及估计文本数据与第一样本干净文本数据之间的损失,对降噪模型的模型参数进行调整,直至满足预设训练结束条件,得到训练完的降噪模型。通过上述方式,本申请能够提升语音降噪的效果。
智能语音指令推荐系统及车载应用 智能语音指令推荐系统及车载应用
本技术提供了一种语音指令的推荐方法、装置和电子设备,包括:当车辆用户手动操作目标车机时,获取目标车机上传的操作埋点数据;根据操作埋点数据确定车辆用户行为;判断预设语音指令库中是否存在车辆用户行为对应的目标语音指令,并判断车辆用户是否使用过目标语音指令;若预设语音指令库中存在目标语音指令,且车辆用户未使用过目标语音指令,则为目标车机推荐目标语音指令,以指导车辆用户进行使用。在本发明的方法中,若车辆用户未使用过手动操作对应的目标语音指令,则会为目标车机推荐上述手动操作对应的目标语音指令,以指导车辆用户进行使用,进而提高了指令的输入效率,且充分利用了目标车机的语音指令功能。
AI语音通信运营管理平台 AI语音通信运营管理平台
本技术公开了基于AI语音通信的运营管理平台,包括语音响应分析单元、语音特征分析单元和信息存储管理单元,本发明涉及语音通信管理技术领域,解决了数据在存储的时候不能综合数据自身的特性来进行综合分析处理,进一步的会导致数据存在存储安全的技术问题,本发明通过对数据进行分类分析,根据不同的数据类型来进行存储,且分类的时候通过根据数据的获取方式来进行综合分类处理,同时针对分类后的数据进行存储分析,在对其进行存储分析的时候,通过对数据中的重复数据进行分析处理,并根据重复数据的特性来进行相应数据的存储,进一步的实现对数据的压缩处理,同时能够实现对数据的加密存储,提高数据存储的安全性。
海洋哺乳动物声信号智能分类系统及其电子设备 海洋哺乳动物声信号智能分类系统及其电子设备
本技术提供了一种大型海洋哺乳动物声信号分类方法及系统、电子设备,包括:获取不同的海洋哺乳动物的声信号数据,并对所述声信号数据进行预处理;根据预处理后的声信号数据得到原始波形特征,并利用Mel与IMel特征提取方法对所述原始波形特征进行特征提取,得到所述声信号数据的时频特征;将所述时频特征和原始波形特征输入混合注意力网络与特征融合模型中进行全局特征提取,并利用所述全局特征对所述声信号数据进行信号分类,解决了目前缺少将时频特征谱图和波形特征这两种不同特征进行融合的技术问题,极大的提高了声信号的分类效率以及分类的准确率,很大程度上提高了本发明的智能化程度、可用性和可靠性。
高效字级时间戳生成技术、设备及存储方案 高效字级时间戳生成技术、设备及存储方案
本文涉及一种字级别的时间戳的生成方法、电子设备和存储介质,该方法包括:在逐帧解码过程中,确定每个字的概率峰值;根据每个字的概率峰值确定每个字的尾端点对应的时间;根据每个字的尾端点对应的时间确定每个字的首端点对应的时间;根据每个字的首端点对应的时间和每个字的尾端点对应的时间生成字级别的时间戳。本申请通过基于深度神经网络的输出分数,以及解码过程中输出每个字时打分的变化规律,确定每个字的概率峰值,根据每个字的概率峰值确定每个字的首端点对应的时间和每个字的尾端点对应的时间,提供了获取字级别时间戳的方法,能够输出字级别上精确的时间戳信息,从而得到高精度的边界信息,提升了用户体验。
智能对话回复控制技术:方法、设备、电子装置及存储介质 智能对话回复控制技术:方法、设备、电子装置及存储介质
本文实施例提供了一种对话回复内容的控制方法、装置、电子设备及存储介质,其中方法包括:获取多种附加特征信息;根据机器人与用户的对话上下文确定用户行为特征;从多种附加特征信息中确定与用户行为特征匹配的目标附加特征信息;采用目标附加特征信息修饰机器人的身份提示语,根据目标附加特征信息控制机器人的对话回复内容。通过本实施例提供的对话回复内容的控制方法,采用与用户行为特征匹配的目标附加特征信息修饰机器人的身份提示语,通过目标附加特征信息调控机器人的对话回复内容,使得机器人的对话回复内容具备可调控性,且实现过程便捷,在开发及部署成本方面具有显著优势。
检测伪造语音的技术、设备、存储介质及电子装置 检测伪造语音的技术、设备、存储介质及电子装置
本文公开了伪造语音检测方法、装置、存储介质及电子设备。该方法包括:采集待检测的语音信号,将所述语音信号转换为时序数字信号,并对所述时序数字信号进行预处理,得到离散语音信号;在所述离散语音信号上进行傅里叶变换得到幅度谱,在所述幅度谱上进行二次插值,得到每个频率窗口的峰值,组合所述峰值得到所述离散语音信号的峰频矩阵;提取所述离散语音信号的线性频率倒谱系数,将所述峰频和所述线性频率倒谱系数进行拼接得到融合特征;将所述融合特征输入训练好的伪造语音检测模型进行伪造语音识别。本申请能够提高伪造语音检测的准确率。
创新维纳增益优化技术 创新维纳增益优化技术
本技术公开了一种维纳增益的设计方法,包括:进行维纳增益估计,将估计获得的维纳增益作为后置滤波器,所述维纳增益估计过程包括:根据波束形成器输出的输出信号进行信噪比估计,得到信噪比估计值;在噪声和混响环境下,根据信噪比估计值及由麦克风阵列采集的观测信号进行相干散射比估计,得到相干散射比估计值;根据信噪比估计值及相干散射比估计值进行增益估计,得到维纳增益。本发明综合考虑了CDR和SNR来设计维纳增益,大大提升了语音增强技术在语音降噪、失真度控制以及去混响能力等方面的性能。
FPGA驱动的深海声学数据压缩技术与设备 FPGA驱动的深海声学数据压缩技术与设备
本文涉及声波数据处理技术领域,具体涉及基于FPGA的深海水声数据压缩方法与装置,该方法包括:根据深海水声数据模态分解得到IMF波的能量分布进行分段处理,得到各段声音数据;根据任意两段声音数据的振幅数值及变化的相似情况,得到声音相似性度量;根据所有不同IMF波上相同时间段的声音数据以及同一IMF波上不同声音数据的声音相似性度量,得到信息浓度;根据信息浓度选取小波变换过程中的小波基函数组,对所有IMF波小波变化后的小波系数进行量化后编码,得到深海水声数据的压缩结果。本申请可提高深海水声数据的压缩质量。
自适应感知技术在一维离散信号活动检测中的应用 自适应感知技术在一维离散信号活动检测中的应用
本技术提供了一种自适应感知的一维离散时间信号活动检测方法和系统,首先通过预加重补偿一维离散时间信号的频谱衰减,然后将预加重后的一维时间信号流按固定长度分成多个短的时间帧,接着对帧信号进行加窗处理,随后计算单帧信号的短时能量积分,并进行动态能量阈值调整,阈值调整包括自适应跟随阈值调整和后级识别神经网络辅助调整,调整后得到一个当前的能量阈值,在得到的当前能量阈值的基础上加上一个常数作为判决阈值,最后采用判决阈值进行信号活动检测,得到信号帧实时的分类结果。通过动态的能量阈值调整,使得最后的能量阈值跟随在信号幅值附近,达到了自适应环境的目的,大大提高了信号活动检测的准确率,降低了设备功耗。
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工