本技术属于声纹识别技术领域,旨在通过声纹特征识别技术实现对通话风险性的评估。该系统和方法主要包含两个步骤:首先,记录并监控通话音频,随后将其上传至数据库;其次,通过分析声纹特征来判断通话中的风险性。
背景技术
声纹识别作为生物识别技术的一种,也称为说话人识别,包括说话人辨认和说话人确认,声纹识别的过程,就是把声信号转换成电信号,再用计算机进行识别,不同的任务和应用会使用不同的声纹识别技术,例如交易过程中,需要通过确认说话人技术,判断通话风险性,判定交易是否正常;
所谓声纹,是用电声学仪器显示的携带言语信息的声波频谱,人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,人在讲话时使用的发声器官--舌、牙齿、喉头、肺、鼻腔在尺寸和形态方面每个人的差异很大,所以任何两个人的声纹图谱都有差异。每个人的语音声学特征既有相对稳定性,又有变异性,不是绝对的、一成不变的,这种变异可来自生理、病理、心理、模拟、伪装,也与环境干扰有关;
而现有的声纹特征识别在通话中应用的过程中,其及时性和效率大多较为一般,难以及时检测到监控通话过程的风险性,很容易因为通话质量差而出现误判的情况,影响判断的准确性,影响用户的使用体验。
实现思路