本技术涉及一种远程语音增强传输方法及系统,属于语音信号传输处理领域。该系统由本地发送端和远程接收端组成。本地发送端负责对含噪语音信号进行短时傅里叶变换,并利用语义编码器提取频谱的语义特征。随后,信道编码器对语音语义特征进行维度调整,并通过信道传输至远程接收端。远程接收端接收语音语义特征信号,通过信道解码器恢复维度,并利用语义解码器解码得到纯净语音信号的实部与虚部,最终通过逆短时傅里叶变换重构语音信号。该技术能够在节约通信资源的同时,显著提升低信噪比信道条件下的语音质量。
背景技术
在传统的语音增强系统中,发送端需要将整段语音发送至接收端,这导致传输的数据往往多于终端任务所需的数据,制约了传输效率,造成了传输资源的浪费。另一方面,语音信号在传输过程中容易受到信道噪声的影响,尤其是在低信噪比情况下,接收端几乎无法从接收到的语音信号中恢复出纯净语音。
语义通信是一种深度学习与无线通信深度结合的全新通信架构,它通过将用户对信息的需求及语义融入通信过程,能够大幅度提高通信效率,且显著提升低信噪比信道条件下的信号传输质量。作为一种新颖的通信范式,语义通信是指在发送端利用神经网络对语义信息进行提取和编码,在接收端从语义的角度对信息进行还原。
得益于深度学习技术的发展,通过设计合理的语义通信模型,能够高效地提取和恢复数据的语义信息,同时降低信道噪声对于传输数据的干扰,并且能大大提高通信系统的传输效率,节省通信资源。
实现思路