虚拟环境操作识别技术、系统、设备、存储介质及软件产品 虚拟环境操作识别技术、系统、设备、存储介质及软件产品
本文提供了一种基于虚拟场景的操作识别方法、装置、设备、计算机可读存储介质及计算机程序产品;方法包括:获取对虚拟场景中虚拟对象执行控制操作所对应的操作数据;对所述操作数据进行分析,得到所述控制操作的操作特征;基于所述操作特征,对所述控制操作进行识别,得到识别结果;其中,所述识别结果,用于指示所述控制操作基于终端显示的所述虚拟场景的界面所输入,或者,基于所述终端的外接设备所显示的所述虚拟场景的界面所输入。通过本申请,能够提高识别准确率并降低识别成本。
多声源环境中目标声源定位与识别技术 多声源环境中目标声源定位与识别技术
本文公开了一种用于检测或估计多个声源中的目标声源的方法、装置和计算机程序,所述目标声源位于多个空间区域中的至少一个目标空间区域,所述方法包括:处理器接收多个信号,所述多个信号中的每一个与多个麦克风信号中的一个相关联,所述麦克风信号包括由所述多个声源产生的声音事件;处理器通过神经网络提取多个特征,所述多个特征是从所述多个信号中提取的,并通过针对所述多个空间区域中的不同空间区域训练所述神经网络,获得所述多个特征中的每一个;所述处理器基于所提取的多个特征生成对应于所述至少一个目标空间区域的另外多个特征;所述处理器基于所述另外多个特征,检测或估计所述目标空间区域中所述目标声源中的至少一个声源。
车载语音控制系统:方法、设备及存储解决方案 车载语音控制系统:方法、设备及存储解决方案
本技术涉及车载语音技术领域,公开了一种车辆语音控制方法、装置、设备及存储介质,该方法包括:按预设分割方式将当前语音信息切分为语义词组,并获取各语义词组的连接顺序;根据连接顺序在车辆指令库中进行匹配,确定当前指令类型,当前指令类型包括:问句型指令、命令型指令以及条件型指令;获取当前指令类型的标准格式,并通过标准格式对当前语音信息进行改写;根据改写后的当前语音信息获得当前执行脚本,并通过当前执行脚本完成交互控制。本发明能够由切分得到的语义词组进行当前指令类型匹配,并根据标准格式实现对当前语音信息的改写,使得改写后的语音信息具有车辆更易识别的完整语义,有利于车辆对用户指令的准确反馈。
虚拟环境闪电效果生成技术与设备 虚拟环境闪电效果生成技术与设备
本文提供了一种虚拟场景中的闪电特效生成方法、装置、电子设备、计算机可读存储介质及计算机程序产品;方法包括:获取虚拟对象的视线方向和待生成的闪电特效的地面投影位置,根据视线方向和地面投影位置确定虚拟场景中用于绘制闪电特效的参考平面;获取针对闪电特效在参考平面中设定的释放起始位置和释放结束位置,生成经过释放起始位置和释放结束位置的线段;获取针对闪电特效设定的分裂参数,基于分裂参数对线段进行随机分裂处理,得到包括一条主干和多条枝干的拓扑结构;对拓扑结构进行网格化处理,得到闪电特效模型;基于闪电特效模型调用渲染程序,以使渲染程序在参考平面中绘制闪电特效。通过本申请,能够对闪电特效的形态进行动态调整。
人机交互中的虚拟对象控制技术 人机交互中的虚拟对象控制技术
本文实施例公开了一种虚拟对象的控制方法、装置、终端、存储介质及程序产品,属于人机交互领域。该方法包括:响应于对虚拟道具的投放操作,控制第一虚拟对象在虚拟环境中投放所述虚拟道具;在所述第一虚拟对象位于所述虚拟道具的道具作用范围内的情况下,在所述第一虚拟对象周围显示虚拟遮罩,所述第一虚拟对象对于所述虚拟遮罩的遮罩范围外的第二虚拟对象不可见;基于所述第一虚拟对象在所述虚拟环境中所处的位置以及所述虚拟遮罩的遮罩范围,显示虚拟环境画面,所述虚拟遮罩用于降低所述遮罩范围外所述虚拟环境的可见度。本申请实施例提供的方法,可有效控制虚拟对象在隐身状态下的攻击命中率,有助于提高游戏对局的公平性。
人工智能云服务中的语音数据训练与播放技术 人工智能云服务中的语音数据训练与播放技术
本文公开了一种模型训练的方法、语音播放的方法、装置及存储介质,应用于人工智能云服务领域。本申请方法包括:获取待训练语音数据集合;当N满足语音训练数量阈值,获取语音模型训练指令;响应于语音模型训练指令,基于待训练语音数据集合,通过待训练语音模型获取预测语音数据集合;基于预测语音数据集合以及待训练语音数据集合,对待训练语音模型进行训练,得到目标语音模型;发送目标语音模型,以使得终端设备存储目标语音模型。本申请提升语音模型生成的灵活性,且满足用户对声音的定制需求,其次,用户进行语音播放时语音模型选择可能性提升,从而提升语音播放的灵活性,进而提升用户的语音播放体验以及灵活性。
低速率通信下的非侵入式窄带语音质量评估技术与系统 低速率通信下的非侵入式窄带语音质量评估技术与系统
本技术属于语音信号处理技术领域,提供了面向低速率通信的非侵入式窄带语音质量评估方法及系统,其技术方案为基于语音数据对构建好的语音质量评估模型进行训练得到训练后的语音质量评估模型;其中,所述语音质量评估模型的构建过程包括:提取语音数据的梅尔频谱特征;基于梅尔频谱特征提取得到语音数据的非对称特征图;将语音数据的非对称特征图分割为多个频段,对各个频段的特征进行增强,得到增强后的特征图;基于增强后的特征图计算每帧语音的评分,基于每帧语音的评分计算整个语音数据的评分;基于训练后的语音质量评估模型对待评估语音数据进行质量评估,无需原始参考信号,有效评估实际通信环境中的语音质量。
AI驱动的语音识别技术、系统及机器人应用 AI驱动的语音识别技术、系统及机器人应用
本技术提供一种基于人工智能的语音识别方法、装置及机器人设备,该方法包括如下步骤:获取终端用户的语音样本并提取样本基准特征;当处于待机状态时,采集第一区域声音段落,预处理第一区域声音段落,并提取目标频域特征;根据目标频域特征提取的数量切换工作状态;当处于解说状态时,采集第二区域声音段落并对第二区域声音段落执行预处理步骤;基于指定频域特征并利用语音识别模型从预处理后的第二区域声音段落中提取出指定语音矢量特征,采用自然语言处理技术分析指定语音矢量特征并生成指定语音反馈文本,将指定语音反馈文本进行语音解说播报。本发明具有在复杂环境时也可以准确识别和处理用户语音指令的效果。
双向蒸馏技术在游戏AI训练中的应用 双向蒸馏技术在游戏AI训练中的应用
本技术公开了一种适用于游戏AI的双向蒸馏方法及装置,包括:每次迭代训练中,随机从游戏AI智能体的训练群体中分离出部分智能体作为虚拟群体,并分配虚拟群体策略;将训练群体和虚拟群体部署在游戏中进行训练,训练群体使用学习策略网络进行更新,虚拟群体使用蒸馏策略网络进行更新;蒸馏策略网络包含正向蒸馏和反向蒸馏;执行正向蒸馏时,通过最小化蒸馏策略与学习策略之间的KL散度;执行反向蒸馏时,通过最大化蒸馏策略与学习策略之间的KL散度;重复上述步骤进行多次迭代训练,训练完成后利用更新后的训练群体作为最终的游戏AI智能体,并部署进游戏中。本发明使得游戏AI能够在复杂游戏场景中优化其策略分布。
列车司机语音识别技术:深度学习与预处理方法 列车司机语音识别技术:深度学习与预处理方法
本文公开了一种列车司机语音识别方法、设备、介质及产品,涉及深度学习及语音识别技术领域,该方法包括获取列车司机的语音信息;对语音信息进行去噪处理、预处理和快速傅里叶变换,得到第一频谱特征;将第一频谱特征输入到专有词汇识别模型,得到专有词汇识别结果;将第一频谱特征输入到通用词汇识别模型,得到通用词汇识别结果;对专有词汇识别结果和通用词汇识别结果进行融合处理,得到列车司机的语音识别结果。通过融合专有词汇识别模型与通用词汇识别模型的识别结果,获得了列车司机的语音识别结果,这种融合处理有效地弥补了通用模型在铁路领域识别上的局限性,从而提高了列车司机语音识别的准确性。
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工