超声波汉语语音防窃听干扰技术 超声波汉语语音防窃听干扰技术
本技术公开了一种面向汉语语音防窃听的基于超声波的录音干扰方法,设计用户无感的语音窃听干扰技术,并充分考虑现实条件下窃听者的能力及其造成的声学隐私泄露风险,增强系统的有效性与安全性,使用语音生成技术扩充用户语料,针对汉语语音特点将语料切割为不含语义的音素,减少了用户的语音注册时间成本,保护了用户注册语音的隐私,增强了对于汉语语音的保护能力,根据用户的声音生成与用户声音耦合的噪声,增加了窃听者分离噪声的难度,更完全地保护用户的语音不被窃听,针对超声发射设备的可听声泄露问题对超声信号进行修正,削弱了可听声的泄露程度,增强了用户的使用体验,降低了超声发射设备被窃听者发现的风险。
音频信号检测技术:方法、系统、设备及存储介质 音频信号检测技术:方法、系统、设备及存储介质
本文涉及一种信号检测方法、系统、设备、可读存储介质和程序产品。所述方法包括:获取待处理的音频信号;确定音频信号对应的时频图,对时频图进行分割处理,得到多个局部窗口以及确定每个局部窗口的局部频域特征;对每个局部窗口的局部频域特征进行功率熵计算,提取音频信号的频谱混沌特征;获取已学习正常音频的特征分布的超球体,确定频谱混沌特征和超球体之间的马氏距离;根据马氏距离确定频谱混沌特征对应的音频信号的异常结果。采用本方法能够有效的区分正常音频信号和所有异常音频信号。
高效识别游戏加速作弊技术、系统、设备与存储介质 高效识别游戏加速作弊技术、系统、设备与存储介质
本文公开了一种识别游戏变速外挂的方法、装置、设备及介质,本申请属于互联网技术领域。该方法包括:若检测到反外挂触发事件,生成启动指令,以启动反变速外挂系统;采用第一检测机制对操作系统的API进行Hook检测,得到第一检测结果;采用第二检测机制对游戏系统进行时间异常检测,得到第二检测结果;采用第三检测机制对游戏任务执行时长进行检测,得到第三检测结果;根据所述第一检测结果、第二检测结果以及第三检测结果中一个或者多个,确定游戏运行过程中是否使用变速外挂。本技术方案,可以在用户运行游戏时,启动反变速外挂系统,采用多种机制检测游戏系统中与接口和时间相关的参数,精准打击变速外挂,维护游戏的公平性,提供和谐游戏环境。
多语言语音识别技术、设备及存储解决方案 多语言语音识别技术、设备及存储解决方案
本公开涉及一种多语种语音识别方法、装置和存储介质。该方法包括:获取待识别音频,待识别音频包括一种或多种语言的音频;提取待识别音频的声学信息,并基于声学信息进行特征提取确定语种信息;基于语种信息以及多个文本信息,确定目标文本信息,其中,多个文本信息是基于上一帧待识别音频的音频识别结果确定的,不同文本信息对应不同语种;基于声学信息和目标文本信息,确定待识别音频的音频识别结果。根据本公开实施例,能够提高多语种的语音识别效果,提高识别精度。
音频伪造检测:特征聚类与对比学习技术 音频伪造检测:特征聚类与对比学习技术
本技术公开了一种基于特征聚类与对比学习的伪造音频区域检测方法,涉及音频信号处理领域,包括多维度特征提取模块、特征融合模块、基于聚类的帧级别伪标签生成模块、区域粗定位模块、基于对比学习的区域伪造音频检测模块、区域重定位模块、后处理模块。本发明中通过从音频数据中提取多维度信息,使用聚类方法对音频数据生成帧级别伪标签,定位不同类别音频区域,通过对比学习训练音频区域真伪的检测模型,可以获得精准的伪造区域定位和音频真伪的检测结果;该方法不仅适用于单一语言的伪造音频检测,还可推广至多语言、多口音的音频场景,尤其适用于司法鉴定和媒体审核等需要精确音频分析的应用场景,具有广泛的实用价值。
深度学习驱动的昆曲自动合成技术 深度学习驱动的昆曲自动合成技术
本技术提出了一种基于深度学习的端到端昆曲合成系统方法,其中所述系统包括:曲谱特征提取模块,用于根据所输入的昆曲曲谱提取出曲谱特征;唱词文本特征提取模块,用于对所输入的昆曲唱词文本提取出唱词文本特征;特征对齐模块,用于基于自注意力机制模型将曲谱特征与文本特征进行对齐,将曲谱特征对应的音高和节奏信息与唱词文本特征的发音时序相结合;声学参数生成模块,用于利用以上对齐处理后的曲谱特征以及唱词文本特征构建声学参数预测模型,并根据所生成的声学参数预测模型预测关键声学特征;昆曲语音生成模块,用于基于深度生成模型的声码器根据所生成的关键声学特征转化为昆曲音频。本发明增强高了对昆曲韵律的还原,昆曲自然度更高。
基于人声迁移学习的海洋哺乳动物声音识别技术 基于人声迁移学习的海洋哺乳动物声音识别技术
海洋哺乳动物声音由于缺乏带注释的训练数据,目前难以使用有监督方式训练的大规模神经网络模型。受到人类声音和海洋哺乳动物声音重叠频率的启发,我们发明了Man2Marine方法,使用大量未注释的人声来预训练自监督大模型,然后使用海洋哺乳动物的声音对其进行微调。同时为了解决预训练自监督大模型中的过度参数化,难以应用的问题,使用了知识蒸馏技术来压缩模型参数。该方法显着降低了获取海洋哺乳动物声音数据的成本,为海洋哺乳动物声音研究提供了一种有实际应用价值的方法。
大数据驱动的智能外呼系统 大数据驱动的智能外呼系统
本技术涉及智能外呼技术领域,且公开了一种应用大数据技术的智能外呼系统,包括任务管理单元、外呼单元、处理单元、记录单元、中心单元、收集单元以及排序单元,任务管理单元用于进行外呼类型选择,外呼单元用于进行客户外呼服务,记录单元用于记录一周内的外呼记录并计算出外呼量W,处理单元接收外呼量W并进行处理后发送分析指令给中心单元;本发明首先设置选择模块,选择模块内有六种类型,此六种类型可将现有大部分所需外呼的行业进行覆盖,进而初步满足不同行业的使用要求,在不同行业内进行使用时,可通过数据库提供数据支撑,保证不同的行业在进行外呼时均有相应的语音进行使用,使其更加智能且具有适应性。
数字人驱动的多情感语音合成技术 数字人驱动的多情感语音合成技术
本技术公开了一种基于数字人的多情感语音合成方法,包括以下步骤:获取多种情感下的音频语料;提取所述音频语料中的文本信息和音素时间戳,构建第一训练数据集;通过所述第一训练数据集对预先构建的音素时间戳预测模型进行训练;通过训练好的所述音素时间戳预测模型,预测所述文本信息中各个发音音频的音素戳和发音帧长,生成音素序列;将所述音素序列输入至预先训练好的声学模型,得到合成音频;本发明能够避免韵律标签的人工加入,提高模型训练效率;通过对音频时域和频域特征的学习,实现更逼真的音频合成效果。
高效特征提取技术:应用于8K至16K语音采样率 高效特征提取技术:应用于8K至16K语音采样率
本文涉及一种特征提取方法、装置、电子设备和存储介质,应用于8K升16K采样率的语音,该方法包括:在特征提取过程中,获取高频部分多维MFCC特征能量值;判断所述高频部分多维MFCC特征能量值是否满足置零条件的特征;若判断结果为所述高频部分多维MFCC特征能量值满足所述置零条件的特征,则将所述特征能量值对应的维度设置为可能置零的标注位。本申请通过对比不同采样率的特征差异,将40维中代表高频部分,就是最后7位的部分数值进行置零,从而优化特征提取的方法来弥补损失性能,通过优化升采样数据特征提取方法,使得转换的特征表达更加接近训练的语音数据,提升模型性能,特征的兼容约泛化,对数据的要求会相对降低,减少数据采集和处理的成本。
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工