AI大模型驱动的决策辅助系统与方法 AI大模型驱动的决策辅助系统与方法
本技术涉及强化学习技术领域,公开了一种基于AI大模型的辅助决策方法及系统,在虚拟环境下的军事训练中,采用强化学习训练的智能体来作为对抗方辅助指挥官进行训练,其中,智能体在线训练机制包括以下步骤:采集训练数据,编码为观测向量;智能体根据采取的信息选择一个第一动作;智能体执行动作之后获得奖励并且存储经验到经验回放池;智能体通过训练好的第一神经网络获得训练启动的时刻和采集的经验数;到达启动时刻后采集经验启动训练。本发明可以通过提供一种智能体在线训练机制,可以有效地分配服务器的数据处理任务,从而使服务器的处理能力需求的峰值降低,并且保证了智能体的对抗强度。
利用高级神经预测器生成黑盒语音对抗样本的技术 利用高级神经预测器生成黑盒语音对抗样本的技术
本技术公开了基于增强型神经预测器的黑盒语音对抗样本生成方法,具体包括:步骤1对于音频x随机生成n个扰动方向向量,对于扰动方向向量进行搜索并使用ASR模型进行查询,以确定使ASR模型错误识别的最小扰动,生成数据集;步骤2设计增强型神经预测器;步骤3使用数据集对增强型神经预测器进行训练,找到新的最优扰动方向向量;步骤4对于新的最优扰动方向向量使用优化后的搜索过程进行搜索并使用ASR模型查询以确定使ASR模型错误识别的最小扰动,从而得到新的样本并加入数据集中;步骤5重复步骤3~4,直到找到对抗样本。本发明方法解决了现有技术中存在的搜索过程复杂低效、生成扰动过大的问题。
路面湿滑状态监测:基于音频分析的创新方法 路面湿滑状态监测:基于音频分析的创新方法
本技术涉及一种基于监控音频的路面湿滑状态检测方法,包括特征提取和模型训练两部分。特征提取部分:本发明从音频的时域和频域两个角度出发,分别探索同一类别音频数据内在能量分布规律、频谱熵计算结果与时序依赖关系并加以时频域的分析融合,发明出一种适用于不同环境下车辆音频分类的行车音频表征特征。模型训练部分:选取深度学习预训练模型,分别从模型架构与模型训练两个不同的角度对其进行优化,实现端到端的方式进行路面湿滑状况的检测与识别。本发明能检测不同湿滑状态下的公路表面,检测的准确率较高。
植物超声波监测与数据可视化系统 植物超声波监测与数据可视化系统
本文章公开了植物声音收集与处理装置,所述培育箱体的内部两侧边端均固定安装有安装板,且安装板的边部安装有超声波传感器,所述连接导线远离超声波传感器的一端与树莓派相连接,本实用新型通过将超声波传感器和树莓派来组成监测结构,方便收集植物超声波并进行信号转换,将其转换为图形类可视化数据,解决了判断植物是否发声,以及植物信息全过程收集并转化为可视化数据的难题,为植物声音的采集和记录提供了新思路,该监测结构还能够用于研究和监控植物的生长和行为,便于获得关于植物健康、生长条件和行为的实时数据,对于农业研究、生态监测和环境科学领域来说能够助推农业现代化发展,实现智慧农业。
扩散增强与多尺度特征融合技术在语音情感识别中的应用 扩散增强与多尺度特征融合技术在语音情感识别中的应用
本技术属于情感计算技术领域,具体涉及一种基于扩散增强和多粒度特征融合的语音情感识别方法,该方法将音频转换为梅尔频谱图;将梅尔频谱图输入扩散模型中,再逐步进行正向扩散注入噪声和反向扩散去除噪声,以恢复出更加清晰的音频;提取增强后音频的特征,然后从音频中提取出帧级特征、段级特征和话语级特征,再进行自适应特征选择,通过权重位置依赖进行深层融合;将融合后的多粒度语音特征输入动态图卷积情感分类模型,生成情感状态识别结果。本发明可提供多分类语音情感识别和语音质量增强等服务,从而在交互中提供更加人性化的响应。
深度学习驱动的农业病虫害方言语音智能识别技术 深度学习驱动的农业病虫害方言语音智能识别技术
本技术公开了一种基于深度学习技术的农业病虫害类方言语音智能识别方法,将梅尔频率倒谱系数和卷积神经网络进行结合,将全部流程拆分为两个阶段,预训练阶段包括长语音文件录制与存储、提取文件中语音信号的特征、训练神经网络模型,再训练阶段则是短语音文件录制与存储、提取文件中语音信号的特征、验证测试结果、模型参数的调整、保存最优模型;通过考虑不同地区人员的口音,对农业田地中监测人员口头汇报的方言语音信息进行智能识别,有效提高了对复杂方言语音信号的识别准确率,尤其是在农业病虫害相关术语的理解上。
GTCN驱动的实时语音情感分析技术与设备 GTCN驱动的实时语音情感分析技术与设备
一种基于GTCN的实时语音情感识别方法及应用装置,涉及生物特征识别技术领域,方法包括:步骤一、搜集一定数量的虚拟现实交互式语音游戏玩家的语音数据,对提取出来的数据进行预处理,包括端点检测和分帧加窗的操作;步骤二、提取预处理过后的语音数据的组合特征作为输入数据;步骤三、构建基于GTCN的模型,将输入数据经过训练,判断输入语音的情感;步骤四、结合输入数据和模型中的情感分类,与识别对象进行交互。相比其他语音情感识别方法,本技术实现了更高的准确率,在多个数据集中都表现出更佳的情感分类效果和更好的鲁棒性,并且能够以更高的效率和更低的内存进行训练,是一种高效稳定的语音情感识别方法。
教学视频语音转文本的综合提取技术 教学视频语音转文本的综合提取技术
本技术公开了一种综合性教学视频语音文本提取方法。首先基于训练过的CLDNN模型来对视频中的语音进行识别;然后基于训练过的双重对抗网络来对步骤1中所提取的语音进行噪声去除,以得到去噪后的语音。最后采用训练后的端到端的语音识别模型进行后端处理,其中端到端的语音识别模型基于Conformer建立,将去噪后的语音输入至语音识别模型,然后对输出结果进行自然语言处理,从而得到文本内容。本发明针对教学视频的特性,通过包括语音活动检测、语音增强和后端处理三个部分的综合方案来实现文本提取,同时引入Noisy Student Training半监督学习方法以使得模型可以在大规模无标签的数据下习通进行学。过实验证明,本文提出的方案可以有效地提高文本提取的效率与准确性。
远程语音增强传输技术:基于语义通信的方法与系统 远程语音增强传输技术:基于语义通信的方法与系统
本技术公开了语音信号传输处理技术领域的一种基于语义通信的远程语音增强传输方法及系统,系统包括:本地发送端,用于:对待增强的含噪语音信号进行短时傅里叶变换后,利用语义编码器对含噪语音信号频谱进行语义特征提取;然后利用信道编码器对语音语义特征进行维度调整;最后通过信道传输至远程接收端;远程接收端,用于:接收通过信道传输过来的语音语义特征信号;利用信道解码器对接收到的语音语义特征信号进行维度恢复后,利用语义解码器进行语义解码得到预测纯净语音信号的实部与虚部,最后进行逆短时傅里叶变换得到重构语音信号。本发明可以在节约通信资源的情况下,显著提高远程接收端在低信噪比信道传输条件下恢复的纯净语音质量。
语音识别技术:系统、设备及存储解决方案 语音识别技术:系统、设备及存储解决方案
本文涉及一种语音识别方法、装置、计算机设备和存储介质。所述方法包括:获取待识别语音的当前帧和当前帧之前的历史帧,并将当前帧和当前帧之前的历史帧作为第一分块,进而根据第一分块和目标合成预测器,模拟出第一分块对应的未来帧,从而根据第一分块、未来帧和目标声学模型,确定待识别语音的语音识别结果。采用本方法能够降低识别的延迟时间。
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工