高效声音转换技术:模型更新与应用策略
2025-02-11 19:42
No.1338958513418018816
技术概要
PDF全文
本技术方案介绍了一种高效的声音转换模型更新及应用方法,属于计算机技术领域。该方法能够显著减少采集新音色样本音频所需的时间和成本。具体步骤包括:步骤A:利用现有声音转换模型进行初步处理;步骤B:通过优化算法对模型进行微调,以适应新的音色需求;步骤C:将更新后的模型应用于实际声音转换任务中,实现高效的声音转换效果。
背景技术
目前,基于声音转换(voice conversion,VC)算法训练得到的声音转换模型,可实现在语义内容不变的情况下对音色的转换。比如,基于VC算法训练得到的声音转换模型可实现将动漫人物A的声音转换为动漫人物B的音频,但原始声音中所具备的韵律信息(如顿挫、重读、语速等)却无法进行灵活调整。 由于在训练声音转换模型的过程中无法采集所有可能的音色的音频,所以声音转换模型难以实现对任意音色的转换功能,并且对于训练音频数据需要原始音色和目标音色内容一致或者对于训练数据的语义范围有限制,训练数据量大,成本高。 现有的,当需要增加新的目标音色的转换功能时,需采集新音色的样本音频重新对声音转换模型进行更新,以使更新后的声音转换模型支持对新音色的转换功能。然而,现有在对声音转换模型进行更新时,需要花费大量的时间和成本采集较多的新音色的样本音频。
实现思路
阅读余下40%
技术概要为部分技术内容,查看PDF获取完整资料
该技术已申请专利,如用于商业用途,请联系技术所有人!
技术研发人员:
王斌
技术所属: 魔珐(上海)信息科技有限公司 上海墨舞科技有限公司.
相关技术
培养儿童绘画能力的教学临摹涂鸦设备 培养儿童绘画能力的教学临摹涂鸦设备
音频处理方法、模型训练方法及装置、设备、存储介质、产品 音频处理方法、模型训练方法及装置、设备、存储介质、产品
一种助力柔性护具及其参数化生成方法 一种助力柔性护具及其参数化生成方法
一种康复训练装置 一种康复训练装置
一种松软泥壤环境中高牵引的仿生步行轮 一种松软泥壤环境中高牵引的仿生步行轮
摇臂滚珠抬升机构 摇臂滚珠抬升机构
一种用于展示机械臂机械原理的教具 一种用于展示机械臂机械原理的教具
拔罐器、拔罐训练装置及方法 拔罐器、拔罐训练装置及方法
一种基于触听融合的智能盲人象棋实现方法及装置 一种基于触听融合的智能盲人象棋实现方法及装置
基于虚拟现实场景的英文单词诵读记忆方法与系统 基于虚拟现实场景的英文单词诵读记忆方法与系统
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工
苏ICP备18062519号-5 © 2018-2025 【123技术园】 版权所有,并保留所有权利