本申请适用于人工智能技术领域,提供了一种基于因果隐马尔可夫模型的音频分类方法及相关设备,所述方法包括:通过Opensmile在预设音频数据集中提取各个音频数据的初始特征集;按预设规则对所述初始特征集进行筛选,得到预设目标特征集;根据所述目标特征集和与所述目标特征集对应的属性信息对预设因果隐马尔可夫模型进行训练,得到目标因果隐马尔可夫模型;通过Opensmile获取待识别音频数据的待识别特征集,并按所述预设规则对所述待识别特征集进行筛选,得到待识别目标特征集;将所述待识别目标特征集输入所述目标因果隐马尔可夫模型,得到与所述待识别音频数据对应的识别结果。
背景技术
近年来,机器学习和深度学习方法在阿尔茨海默症检测预警中得到了越来越多的应用。传统的机器学习方法,如支持向量机(SVM)和随机森林(RF),通常依赖于对预先定义的特征进行分类,从而实现不错的阿尔茨海默症检测预警效果。随着技术的进步,深度学习方法逐渐成为研究的热点,特别是卷积神经网络(CNN)和循环神经网络(RNN),在处理多模态数据方面展现出了强大的能力。例如,CNN可以处理大脑影像数据,而RNN则适用于分析时间序列数据,如声学和语言特征。然而,尽管这些方法在精度上有显著提高,但其可解释性较差,且训练过程对数据量和计算资源要求较高。此外,深度学习模型在实际应用中,往往需要大量标注数据进行训练,这在一定程度上限制了其在阿尔茨海默症检测预警中的普及应用。
使用基本的声学特征对阿尔茨海默症检测预警具有很强的可解释性,但效果往往不尽如人意;而使用深度学习方法虽然效果较好,但其可解释性较差。而且现在大多机器学习和深度学习的方法没有考虑到病情发展的影响,即没有考虑时序因素,导致对阿尔茨海默症的检测结果不理想。
实现思路