音频关键语义信息智能检测技术
2025-02-02 18:34
No.1335679800333049856
技术概要
PDF全文
本技术介绍了一种音频关键语义信息的智能检测方法,该方法应用于语音识别技术领域。该技术采用的关键语义信息检测模型由识别网络和多个与预定义关键词匹配的分类器构成。
背景技术
关键语义信息检测在音频信息安全领域扮演着至关重要的角色,其在通信安全、隐私保护、内容监控等多个方面均具有广泛的应用价值。传统的检测方法主要依赖于特定关键词的匹配,采用如正则表达式或字典查询的简单模式匹配技术。然而,这些方法在复杂环境下的准确率和适应性存在明显不足。 近年来,随着深度学习技术的飞速发展,基于深度学习的音频关键语义信息检测方法取得了显著成果。这些方法通过神经网络模型自动学习和提取音频特征,有效识别音频内容中的关键语义信息。 自动语音识别(ASR)是一种将语音转换为文本进行识别的方法。使用ASR进行关键语义信息检测时,通常需要对整个音频序列进行转写,然后在转写文本中搜索关键词。这意味着,无论关键词出现在音频的哪个位置,系统都必须处理完整的音频数据。由于需要处理整个音频流,计算量大,处理时间长,尤其在音频长度较长或实时处理的情况下,效率问题更加突出。另外关键词的位置不确定性使得ASR系统更容易受到背景噪声和非关键词语音的干扰,增加了误识别的概率。 固定窗口法则是通过在信号上滑动固定长度的窗口来分析或处理数据。使用固定时间窗口进行特征提取和检测时,如果关键词长度或出现位置与预设窗口不匹配,可能导致关键词被截断或遗漏。因此固定窗口法对关键词的位置高度敏感,无法适应关键词在音频中任意位置出现的情况。 由此可见,现有的基于深度学习的关键语义信息检测方法主要两个问题,一是计算量大、效率低下,无法在资源受限的设备上运行并保持较好的检测性能;二是检测效果受关键词位置的影响较大。
实现思路
阅读余下40%
技术概要为部分技术内容,查看PDF获取完整资料
该技术已申请专利,如用于商业用途,请联系技术所有人!
技术研发人员:
周伟  徐从安  方伟  高龙  吴俊峰  李常宝  王书龙  顾平莉
技术所属: 中国人民解放军海军航空大学
相关技术
一种游戏事件提示方法 一种游戏事件提示方法
语音生成方法、装置、设备、存储介质及产品 语音生成方法、装置、设备、存储介质及产品
深度学习辅助的枪声检测与定位方法 深度学习辅助的枪声检测与定位方法
一种基于多层神经网络的多声音事件检测方法 一种基于多层神经网络的多声音事件检测方法
一种基于模态自适应学习的多模态课堂情感识别方法及系统 一种基于模态自适应学习的多模态课堂情感识别方法及系统
一种基于BERT预训练语言模型的语音指令识别方法 一种基于BERT预训练语言模型的语音指令识别方法
复杂海洋环境下仿嘀嗒声水声仿生通信信号识别方法及系统 复杂海洋环境下仿嘀嗒声水声仿生通信信号识别方法及系统
基于梯度类激活映射的水下目标噪声源分类模型可解释性方法 基于梯度类激活映射的水下目标噪声源分类模型可解释性方法
语音交互方法、服务器及计算机可读存储介质 语音交互方法、服务器及计算机可读存储介质
一种语音识别模型的语料扩充方法、装置、电子设备及计算机可读存储介质 一种语音识别模型的语料扩充方法、装置、电子设备及计算机可读存储介质
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工
苏ICP备18062519号-5 © 2018-2025 【123技术园】 版权所有,并保留所有权利