本申请公开了单通道音频转文本的方法、装置、电子设备及存储介质,所述单通道音频转文本的方法包括:获取会议场景中两次语音停顿之间的参会人发言的待转写音频;获取所述待转写音频中各参会人的角色音量信息;根据各所述角色音量信息,在各参会人中确定理论输出所述待转写音频的目标参会人;将所述待转写音频转写成具有所述目标参会人的身份标识的音频文本。本申请解决了多角色参与的音频转写成具有参会人信息的音频文本对CPU性能要求较高的技术问题。
背景技术
在目前各类社会活动,尤其是商业活动中,几乎每时每刻都有人在进行各种会议,会议结束后也都需要根据会议中讨论的内容以及形成的决议等,做成会议记录发给与会人员,或者存档,目前,若要实时将多角色参与的音频转写成能够区分说话人的文本,需要多通道同时分别转写不同的参会人的音频,对CPU(central processing unit,中央处理器)性能要求较高。
实现思路