本技术介绍了一种创新的声音复制技术及其系统,该技术涵盖以下步骤:步骤S1,预训练说话人编码器,即准备并预训练说话人编码器;步骤S2,预训练语音合成模型,即准备并预训练语音合成模型。
背景技术
随着语音合成技术的发展,大众开始追求更加个性化以及与自身更加具有亲近感的音色,固定音色的语音合成服务已不能满足实际场景的需求。而声音复刻技术的诞生满足了这一现实需求。
声音复刻技术是由语音合成技术发展而来,能够利用少量样本,快速地复刻出用户的声音,并达到高质量的合成效果。然而,现有的声音复刻技术需要利用大量训练样本,对音频质量的要求高,合成效果不稳定、鲁棒性差,有待改进和完善。
实现思路