本技术介绍了一种新型智能设备及其语音交互技术,该技术能够接收用户的语音指令,生成相应的反馈语句,并依据预设的情感评分系统对反馈语句进行情感评分,以提升用户体验。
背景技术
智能语音控制是一种新型的交互方式,可通过对用户输入的语音信息进行语义识别,再根据语义识别结果生成控制指令,从而控制设备运行。为了实现基于智能语音控制的交互过程,智能设备中可以内置智能语音系统。智能语音系统可以由硬件部分和软件部分组成。其中,硬件部分主要包括麦克风、扬声器以及控制器,用于接收、反馈和处理语音信息;软件部分主要包括语音转换模块、自然语言处理模块以及控制模块,用于将输入的声音信号转化为文字信号,并形成具体的控制指令进行控制。
智能语音控制系统可以通过语音播报的方式反馈语音控制结果。例如,当用户输入语音“我想看××的电影”后,智能语音系统会触发媒资查找或推荐功能,使智能设备呈现媒资推荐界面,同时播放语音“已为您找到××的电影”。由于语音播报的内容是由智能语音系统将多个预先录制或生成的语音片段组合而成,因此在播放语音播报内容时,会出现不符合常规语言规范的播放效果,例如,不正确的断句,错误的情感等,降低用户的交互体验。
为了提升用户的交互体验,智能语音系统可以通过录制多种情感表达形式的语音片段,并在不同的控制过程中播放相适应的语音片段,从而对语音播报过程赋予相应的情感。例如,使用播音情感播放新闻类别的语音内容;使用朗读情感播放文学作品类别的语音内容。但是这种语音播报方式适配的应用场景较少,即只能针对带有明确场景标签的文本实现语音播报,不能应用在智能问答以及语音控制的过程中,降低了智能语音交互方法的语音播报效果。
实现思路