本技术属于AI数据处理和决策优化技术领域,详细描述了一种依托大数据的AI决策优化技术与系统。该技术涉及获取样本数据集,并依据类别特征的属性增益和关联度进行优化,以提升决策效率和准确性。
背景技术
随着物联网设备和互联网平台的快速发展,基于大数据驱动的预测模型越来越完善,根据限定条件和目标变量进行人工智能决策优化的方式越来越多。但现有的预测模型还存在部分不足,一是现有预测模型在处理数据时,往往难以将类别特征和连续特征同时作为自变量因素纳入模型,类别特征通常使用独热编码(One-Hot Encoding)或标签编码(Label Encoding)转换为数值形式,连续特征则直接使用原始数值,这种处理方式容易导致类别特征和连续特征难以在同一模型中协同工作,影响预测模型中各自变量因素的协同性能。二是在实际数据处理过程中,类别特征和连续特征之间可能存在关联性,这种关联性可能对模型的训练过程产生不利影响。针对上述问题,本发明提出了一种新的处理类别特征和连续特征的方法,将类别特征和连续特征共同转化为标准值,以便在同一个预测模型中同时使用它们从而提高预测模型的协同性能。同时在进行特征标准化时考虑特征之间的相互关联程度,进而提高预测模型的精准性。
实现思路