音频数据标注精度提升:时频增强技术与系统 音频数据标注精度提升:时频增强技术与系统
本技术公开了一种基于时频增强的音频数据标注精度增强方法,该方法包括:数据采集流程,对教师的教学音频进行采集,再将教学音频中的原始信号通过线性声谱图的过渡量转化为梅尔声谱图;数据增强流程,使用VoiceAugment音频数据增强算法对输入的需要标注的教学音频进行数据增强,增强技术由频率信道掩蔽块和时间帧掩蔽块组成,增强了教学音频的特征属性;自动标注流程,使用ANNA模型对教学音频实现自动标注,ANNA模型由波谱图特征获取、声谱图特征获取、特征融合和情感标注等模块组成。本发明实现了教师教学情感的自动标注,提高了教学音频的标注速度和标注精度,克服了因人力标注所致的耗时费力等缺陷,为教师课堂的情感预测等服务提供了较为准确的数据标签。
2025-01-13 00:02
0
0
结合双门限法和残差神经网络的声音识别技术与系统 结合双门限法和残差神经网络的声音识别技术与系统
 本技术公开了一种双门限法与残差神经网络结合的声音语意识别方法及系统,首先自行收集了一套语音数据,针对这套数据进行了数据规范化等预处理操作;然后基于双门限法端点检测,寻找噪音点,进行降噪处理。同时使用分帧、加窗、傅里叶变换等一连串步骤将原始数据集中的所有音频转换为语谱图,得到图像数据集;最后使用深度残差网络对训练集进行训练,并根据训练到的模型在测试集中测试。本发明的优点在于:应用到船舶中实现了较高准确率的方法优化船舶护航能力,相较于人耳识别笛音具有成本低的特性。另外,本方法创新性的提出将端点检测与深度学习相结合的方式对语音进行语义理解,其效果远超单独利用端点检测或深度学习进行语音分类的方式。
2025-01-10 12:08
0
0
基于GFCC特征的语音信息隐藏技术 基于GFCC特征的语音信息隐藏技术
 本技术涉及一种基于语音GFCC特征参数的信息隐藏方法,属于语音识别技术领域。对于N bit的二进制待隐藏信息,选取语音作为待隐藏信息的载体,对载体语音采取无重叠分帧;利用伪随机数发生器产生伪随机数序列,以此确定信息隐藏的位置,将伪随机数序列进行二进制转换,得到密钥K;对隐藏信息的帧信号提取GFCC特征参数并进行二进制编码,再将二进制GFCC编码与待隐藏信息进行异或,得到待隐藏编码;对要隐藏信息的帧信号进行4级DWT分解,并选取4级低频系数构造成两个向量,分别计算向量范数,通过量化向量范数对待隐藏编码进行隐藏,最后进行逆DWT和重组语音帧得到含隐藏信息的载体语音并对其中的隐藏信息进行提取。
2025-01-10 11:20
0
0
高效生物活性分子检测技术及设备 高效生物活性分子检测技术及设备
 本公开提供一种生物活性分子含量的检测方法、装置和电子设备,涉及检测技术领域,解决了现有技术中疾病诊断、药物筛选和健康评估的效率较低的问题。该方法包括采集待分析的振动声音;振动声音由安装有压电传感器的发声装置,在压电传感器的表面附着有生物活性分子时,控制压电传感器以目标频率振动所产生的;将振动声音输入至预先配置好的神经网络模型中,确定振动声音对应的生物活性分子的质量。
2025-01-09 11:15
0
0
多玩家适配型游戏AI训练技术及系统 多玩家适配型游戏AI训练技术及系统
 本技术涉及一种面向不同玩家的游戏AI训练方法及系统,其方法包括:步骤S1:根据对手种类M构建游戏AI的应对策略采样策略πs和奖励模型步骤S2:游戏AI使用采样策略πs与对手交互,采集各种类型对手的交互数据;步骤S3:使用交互数据计算M个对手奖励模型其中,表示第m类对手奖励模型;步骤S4:使用极大极小Q学习算法、游戏模型和奖励模型学习第m类对手的纳什均衡策略作为应对策略重复步骤S4,学习得到所有类型对手的应对策略。本发明提供了一种面向不同玩家的游戏AI训练方法,可以应对对手类型不同的情况,提高使所有玩家的满意度。
2025-01-08 13:09
0
0
噪声干扰下提升说话人识别准确度的模型构建技术 噪声干扰下提升说话人识别准确度的模型构建技术
 本技术公开了一种噪声环境下说话人识别模型构建方法,在说话人识别网络前端增加一个去噪模块,使用改进的谱减法对带噪语音进行去噪。针对谱减法的两个参数(过减因子α和谱下限参数β),使用梯度下降的方法由神经网络动态调整两个参数的值,保留更符合说话人识别任务的语音信息,从而提高了噪声环境下说话人识别的准确率。带噪语音信号选择变窗长的窗函数进行短时傅里叶变换,可以防止频谱泄露说话人识别任务需要的说话人信息。
2025-01-08 09:18
0
0
语音分类技术:利用对齐与自适应融合的创新方法 语音分类技术:利用对齐与自适应融合的创新方法
 本技术公开了基于语音语料对齐与自适应融合的语音分类方法,方法包括:构建语音分类数据集,并划分为训练集与测试集;构建语音分类网络模型,包括对齐构造模块、语音关联性构建模块、片段重要性挖掘模块、融合检测模块;将融合检测模块输出特征输入分类器以获得预测结果;设计用于优化网络模型参数的损失函数,根据损失函数在训练集上采用Adam优化器实现模型参数的迭代优化与更新;训练完成的语音分类网络模型可实现对语音信号的端对端分类。本发明利用深度学习技术通过语音信号实现自动分类,可应用于不同场景,如对情感、性别、年龄等特征的识别,有助于企业分析用户的情感、性别、年龄,从而提供更人性化、更具针对性的服务。
2025-01-01 21:16
0
0
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工
苏ICP备18062519号-5 © 2018-2025 【123技术园】 版权所有,并保留所有权利