音频处理方法、模型训练方法及装置、设备、存储介质、产品
2025-02-28 14:05
No.1345034315880472576
技术概要
PDF全文
本申请实施例公开了一种音频处理方法、模型训练方法及装置、设备、存储介质、产品。音频处理方法包括:在本申请实施例中,获取待配乐的动作视频所对应的节奏条件向量和动作视频的参考和弦,基于节奏条件向量,对噪声数据进行节拍维度的降噪处理,得到动作视频的预测节拍,基于节奏条件向量和参考和弦,对噪声数据进行和弦维度的降噪处理,得到动作视频的预测和弦,对预测节拍和预测和弦进行融合,得到动作视频的配乐。可见,通过不同的约束条件分别对配乐的节拍及和弦进行降噪处理,可以解耦配乐的预测过程,使得节拍及和弦的预测过程更具针对性,进而提高动作视频的配乐的质量。
背景技术
随着科技研究的进步,人工智能模型的相关技术飞速发展。越来越多的人工智能模型被应用在生活中的各个领域;例如,生成式模型被应用在音频生成领域,判别式模型被应用在人脸识别领域等。在音频生成领域,音频生成模型可以根据视频,生成相应的配乐。研究发现,当待配乐的视频为动作视频时,音频生成模型生成的配乐的质量较低(如配乐节奏与动作不匹配、配乐风格与视频风格不一致等)。
实现思路
阅读余下40%
技术概要为部分技术内容,查看PDF获取完整资料
该技术已申请专利,如用于商业用途,请联系技术所有人!
技术研发人员:
王珺  汪金婷  刘李
技术所属: 深圳市腾讯计算机系统有限公司  香港科技大学(广州)
相关技术
培养儿童绘画能力的教学临摹涂鸦设备 培养儿童绘画能力的教学临摹涂鸦设备
音频处理方法、模型训练方法及装置、设备、存储介质、产品 音频处理方法、模型训练方法及装置、设备、存储介质、产品
一种助力柔性护具及其参数化生成方法 一种助力柔性护具及其参数化生成方法
一种康复训练装置 一种康复训练装置
一种松软泥壤环境中高牵引的仿生步行轮 一种松软泥壤环境中高牵引的仿生步行轮
摇臂滚珠抬升机构 摇臂滚珠抬升机构
一种用于展示机械臂机械原理的教具 一种用于展示机械臂机械原理的教具
拔罐器、拔罐训练装置及方法 拔罐器、拔罐训练装置及方法
一种基于触听融合的智能盲人象棋实现方法及装置 一种基于触听融合的智能盲人象棋实现方法及装置
基于虚拟现实场景的英文单词诵读记忆方法与系统 基于虚拟现实场景的英文单词诵读记忆方法与系统
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工
苏ICP备18062519号-5 © 2018-2025 【123技术园】 版权所有,并保留所有权利