配音音频分析技术:方法、设备、电子装置及存储介质
2025-02-15 13:40
No.1340316838227353600
技术概要
PDF全文
本技术提供了一种配音音频分析技术,包括获取配音演员的音频数据,分析生成对应的声谱图,并利用预设参数对声谱图进行匹配分析,以优化配音效果。该技术可应用于电子设备和存储介质,提升音频处理的准确性和效率。
背景技术
什么是口水音:声音工作者(声优、播音员、配音员、歌手等)在高精度的录音或者配音时,口腔内舌头与其它部位产生碰撞、摩擦,形成泡泡,泡泡破裂或配音员吞口水产生的声音,就是口水音。口水音是困扰声音工作者的一个永恒话题,大多数相关从业人员都有这样的情况。口水音对于声音工作者来说影响非常大的,从效果上来讲会影响录音培训的效果,一致达不到录音要求;从工作结果来讲,大量的口水音会导录音工作的返工,扣除费用,对于演员以及工作室的能力产生负面影响。在人工智能相关的工作中,口水音会影响TTS语音的训练效果,曾经在训练某TTS音色时,由于训练音频存在大量口水音,导致效果不佳,被迫重新进行录制的情况,浪费大量时间。因此,对于录音棚来说,如何在录制时第一时间发现口水音并重新录制;对于AI公司来说,如何在拿到音频后快速筛查音频文件是否口水音太多影响模型训练,将变得尤为重要。与此同时,除了口水音,对于专业语音工作者来说,还有齿音、气泡音、呼吸音等各种声音问题。 目前解决该类问题的方法,是通过一个有经验的录音师或者语音分析技术人员,对于录音文件进行筛查,主要是通过听录音结合语音中可能存在的异常点查看声波信息,找到对应的问题点。然后安排后续的补录重录,进行录音筛查的人员必须具有很强的专业知识进行分辨。但是,针对大量的音频,一遍一遍听过来会浪费大量的时间,消耗人力人工进行筛查,无法准确找到所有的问题,在实际的配音录音工作中,录音/配音当时找到声音问题并现场重新录制是最快的,后续再发现耗时费力。
实现思路
阅读余下40%
技术概要为部分技术内容,查看PDF获取完整资料
该技术已申请专利,如用于商业用途,请联系技术所有人!
技术研发人员:
王冬晨陈吉胜
技术所属: 云知声智能科技股份有限公司.
相关技术
一种游戏事件提示方法 一种游戏事件提示方法
语音生成方法、装置、设备、存储介质及产品 语音生成方法、装置、设备、存储介质及产品
深度学习辅助的枪声检测与定位方法 深度学习辅助的枪声检测与定位方法
一种基于多层神经网络的多声音事件检测方法 一种基于多层神经网络的多声音事件检测方法
一种基于模态自适应学习的多模态课堂情感识别方法及系统 一种基于模态自适应学习的多模态课堂情感识别方法及系统
一种基于BERT预训练语言模型的语音指令识别方法 一种基于BERT预训练语言模型的语音指令识别方法
复杂海洋环境下仿嘀嗒声水声仿生通信信号识别方法及系统 复杂海洋环境下仿嘀嗒声水声仿生通信信号识别方法及系统
基于梯度类激活映射的水下目标噪声源分类模型可解释性方法 基于梯度类激活映射的水下目标噪声源分类模型可解释性方法
语音交互方法、服务器及计算机可读存储介质 语音交互方法、服务器及计算机可读存储介质
一种语音识别模型的语料扩充方法、装置、电子设备及计算机可读存储介质 一种语音识别模型的语料扩充方法、装置、电子设备及计算机可读存储介质
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工
苏ICP备18062519号-5 © 2018-2025 【123技术园】 版权所有,并保留所有权利