基于KL散度和置换检验的异常检测与漂移解释技术

123技术园

首页 / 技术内容

2025-02-13 14:39

No.1339607022072766464

技术概要

PDF全文

本技术介绍了一种结合KL散度和置换检验的异常检测与漂移解释方法。该方法首先使用零阳性样本集训练自编码器，然后将待检测样本通过自编码器压缩为低维表示，进而利用孤立森林算法进行异常检测和漂移解释。

背景技术

在异常检测领域，概念漂移指的是随着时间的推移，数据的统计特性或关系发生变化的现象。这种变化可能是由外部环境的变化、数据生成过程的演化、观察偏差或噪声引起的。概念漂移对模型的影响主要体现在它引起了数据分布的变化，导致模型在面对新的数据分布时可能无法有效地捕捉到新的异常模式或变化。这可能导致模型退化、决策偏差和模型更新困难。现阶段概念漂移检测与解释主要有基于错误率的角度，这类方法通过监控分类器错误率的变化来检测漂移。例如，漂移检测算法DDM(Drift Detection Method)算法就是通过比较当前错误率与预设阈值来判断是否发生漂移。这种方法的优点在于实现简单，但缺点是对突然的漂移变化敏感度不高，且在数据本身波动较大时容易产生误判。除此之外，还有基于数据分布的角度进行检测，这类方法直接比较数据分布的变化，如使用KL散度或卡方检验。它们能够捕捉数据分布的细微变化，但计算复杂度较高，且对数据的分布形态有一定假设。山东省计算中心在其申请的专利文献“一种面向概念漂移的可适应可解释的工控系统异常检测方法”(申请号202310809566.8申请公布号为CN 116991137 A)中公开了一种工控系统的概念漂移检测方法。该方法通过获取不同时期的工控数据样本，包括历史数据和新数据，用于训练异常检测模型，并保存训练参数。校准异常检测模型的输出结果，并进行漂移检测，判断数据流中是否存在概念漂移。对检测到的漂移进行解释，以便于理解数据变化的原因。将发生概念漂移的新样本与旧样本中仍然相关的部分结合起来，重新训练异常检测模型，以适应数据分布的变化。该专利方法的优点在于能够判断和适应概念漂移，减少模型的误报率，并且通过解释漂移的原因，提高了模型的可解释性。但是，该方法仍然存在的不足之处是，检测过程中需要较大的计算资源来处理和分析大量的工控数据，且在实际应用中需要不断调整和优化模型参数，以适应不断变化的数据环境。此外，对于快速变化的工控系统，该方法的实时性能和准确性面临挑战。浙江大学嘉兴研究院在其申请的专利文献“一种基于无监督学习的概念飘移缓解方法及装置”(申请号202311825338.6申请公布号CN 117807437 A)中公开了一种概念漂移检测方法。该方法的实现步骤是，1)通过恶意应用分类器的训练样本训练一个无监督学习的自编码器，对于待测样本，使用所述自编码器计算其与各训练样本类别中心的距离，实现漂移样本检测；2)对于检测出的漂移样本，利用特征归因技术，基于各个特征对于漂移检测的贡献，实现样本漂移原因的解释；3)选取漂移样本与解释结果进行标注，利用主动学习框架更新所述恶意应用分类器；4)利用更新后的恶意应用分类器进行软件的分类。该方法通过对训练样本的自编码拟合，实验测试样本漂移的实时检测，并且加入了一个可解释模块，利用嵌入距离计算特征贡献，极大地降低了主动学习框架中的人工标注成本。但是，该方法仍然存在的不足之处是，通过计算待测样本与训练样本类别中心的距离进行漂移检测，难以捕捉复杂或非线性的数据分布变化，尤其是在高维度、噪声较大的数据环境中，较易出现误报或漏报的情况。此外，特征归因模块的计算复杂度较高，会影响大规模实时检测的效率，尤其是在面对大规模数据时，系统的资源消耗与响应速度将成为最大的瓶颈。综上所述，现有技术在数据漂移检测与异常检测中存在以下四个明显的缺点：1.传统的漂移检测方法如基于分类器错误率的检测，灵敏度不高，尤其在数据波动较大时容易产生误报，无法有效捕捉微小的分布变化，影响检测精度。2.现有技术往往仅能检测到数据漂移的发生，但无法明确识别导致漂移的具体原因或样本和特征，缺乏对漂移成因的解释力。3.在处理大规模、高维数据时，现有检测方法的计算复杂度高，资源消耗大，导致检测效率低下，无法实现实时响应。4.现有技术大多依赖大量标记数据，在无监督学习环境下表现较差，无法灵活适应无标注数据的漂移检测。

实现思路

阅读余下40%

技术概要为部分技术内容，查看PDF获取完整资料

该技术已申请专利，如用于商业用途，请联系技术所有人！

技术研发人员：

李腾唐智亮汪凡卓苏国强马卓马建峰

技术所属：西安电子科技大学

相关技术

一种模块化工业算力设备 一种模块化工业算力设备
本实用新型公开了一种模块化工业算力设备，包括电源单元和算力单元，电源单元包括第一箱体、电源和散热风扇，电源和散热风扇均设置于第一箱体内同侧，散热风扇出风口朝向电源。算力单元包括第二箱体、显示屏、开关重启键、DB9接口、USB接口、WiFi网卡天线、工业主板、显卡和显卡挡板，所有箱体均为可拆卸结构，且侧板均设置有散热槽，所有箱体在竖直方向的贴设面均开设有连通的接线开口槽，电源通过接线开口槽连接工业主板和显卡，工业主板设置于第二箱体的底板上，在靠近工业主板的COM引脚的侧板上设置工业主板的IO挡板，WiFi网卡天线和显卡位于IO挡板所在侧板，显示屏位于显卡对侧，本实用新型的算力机构提高了散热效率，使组件的维护和升级更加便捷。
一种基于边缘计算和大数据算法的RV减速器信息管理系统  一种基于边缘计算和大数据算法的RV减速器信息管理系统 
 本发明公开一种基于边缘计算和大数据算法的RV减速器信息管理系统，所述的数字化车间系统包括零件管理模块、权限管理模块、产品装配模块、产品库存管理模块以及产品检测模块。减速器的关键零部件摆线轮、针齿壳、行星架分别打印标记可读取的二维码标志。本发明利用边缘计算方法对制造车间的每个生产环节设置客户端模块系统对减速器的零件装配、零件加工、产品的出入库环节进行信息管理和追溯；在数据处理中采用智能大数据算法的双向映射提高数据的处理效率。本发明确保RV减速器从业务流程到生产制造的各个环节的信息共享、信息流的准确方向，提高RV减速器制造企业对产品信息管理效率和追溯的准确性。
一种独柱墩桥梁加固后的健康监测预警方法及系统  一种独柱墩桥梁加固后的健康监测预警方法及系统 
 本发明公开了一种独柱墩桥梁加固后的健康监测预警方法及系统，属于桥梁健康监测技术领域，通过定制化监测方案确保数据精准可靠，利用实时监测数据与有限元模型分析，精准评估桥梁状态，及时发现并预警潜在安全隐患。该方法不仅针对加固后桥梁的特定结构问题强化监测，还通过资源优化配置提升监测效率与经济性。结合有限元模型修正，显著提高了桥梁状态预测的精度与实用性。此外，预警指标的自适应调整机制确保了预警的准确性与及时性，有效降低了漏报风险。本发明为加固后独柱墩桥梁的安全管理提供了科学、高效的解决方案。
一种具有无极滚轮和侧滚轮的鼠标 一种具有无极滚轮和侧滚轮的鼠标
本实用新型提出一种具有无极滚轮和侧滚轮的鼠标，涉及鼠标产品技术领域，包括主体、侧滚轮键、侧盖，主体的一侧设有安装槽，侧滚轮键倾斜设置并收容于安装槽内，侧滚轮键与主体固定连接且电连接，侧盖固定连接于主体一侧并与主体的表面呈弧面过渡，侧盖遮挡侧滚轮键的一部分，侧滚轮键的一侧凸出于侧盖；本具有无极滚轮和侧滚轮的鼠标能够便于侧滚轮结构的组装，缩短组装工时，提高生产效率。
一种文本展示方法、装置、设备和存储介质 一种文本展示方法、装置、设备和存储介质
本发明实施例公开了一种文本展示方法、装置、设备和存储介质。该方法包括:获取目标文本；将所述目标文本中同一段落内的句子依次两两输入至预先训练好的神经网络模型以得到同一段落内句子间的相似度；根据同一段落内句子间的相似度展示所述目标文本。本发明实施例实现了过滤文本中不协调的内容。
一种多级行政区划要素的快速检索与展示方法及系统 一种多级行政区划要素的快速检索与展示方法及系统
本发明公开一种多级行政区划要素的快速检索与展示方法及系统，属于地理信息技术领域，包括以下步骤:通过拓扑抽稀技术、数据压缩技术及空间索引技术，对图形数据进行预处理，实现图形数据的高质量压缩和高速访问；采用扁平化存储结构设计，对行政区划属性数据进行优化处理，创建属性索引，实现一步检索命中；通过FTS基于自然语言的搜索技术创建全文检索表，使用simple库进行中文分词支持基于行政区划名称的全文检索；通过内存与Redis键值存储系统结合的二级缓存策略，对属性检索实施缓存优化，提高并发性能。本发明可以有效降低实现此种能力的软件系统的技术成本和硬件资源需求，满足业务使用方基于自有数据搭建个性化、低成本的应用需要，而且运行高效。
一种审计数据价值评价方法及设备 一种审计数据价值评价方法及设备
本发明涉及一种审计数据价值评价方法及设备，该方法包括:构建审计数据规则库；标记数据类型信息所属的来源属性；构建数据价值待评价集合；基于审计数据价值评价体系，将数据价值待评价集合与审计数据规则库中对应种类的规则进行匹配比较，得到每项影响因素评分，计算每项影响因素所占的权重，计算得到审计数据价值评价结果。本发明在构建审计数据规则库时，综合考量了数据字典、国家标准、地方标准、行业标准以及专家知识库，将主观评价与客观评价相融合，并基于数据质量、数据内生价值、数据应用价值和市场价值四项影响因素对审计数据价值进行评价，进而得到了准确性和综合性较高的评价结果。
一种基于智能背心生产质量安全溯源方法及系统 一种基于智能背心生产质量安全溯源方法及系统
本发明涉及生产质量安全溯源技术领域，尤其涉及一种基于智能背心生产质量安全溯源方法及系统。所述方法包括以下步骤:获取智能背心生产环节数据，其中智能背心生产环节数据包括原材料采购阶段数据、监测制造阶段数据、质检阶段数据和包装阶段数据；对原材料采购阶段数据进行物料信息提取，得到智能背心物料信息数据；对监测制造阶段数据进行生产设备运行分析，生成生产设备运行数据；对质检阶段数据进行背心质检，生成背心检验数据；对包装阶段数据进行成品包装状态分析，生成成品包装状态数据。本发明通过物联网技术、射频识别技术、数据分析技术和区块链技术，提高了数据分析的多维度、多层次数据综合分析问题。
一种线程监控的方法、装置、计算机设备和存储介质 一种线程监控的方法、装置、计算机设备和存储介质
本申请涉及一种线程监控的方法、装置、计算机设备和存储介质。所述方法包括:建立指针链表，根据指针链表建立线程，其中，指针链表包括线程名称、堆栈信息；根据线程名称和堆栈信息获得线程捕捉信号；根据线程捕捉信号对当前运行的线程的运行状态进行监控。采用本方法能够提高线程崩溃时分析的效率。
一种无线连接式网络计算机 一种无线连接式网络计算机
本发明属于计算机技术领域，具体的说是一种无线连接式网络计算机，通过在底座的表面开设键盘槽，将键盘固定在滑动装置之上，滑动装置可相对于键盘槽向外滑动，从而调整键盘相对于屏幕的距离，使得不同的使用者都能找到一个适合自己的键盘和屏幕间距，减轻由于键盘位置不适而造成的，颈部、背部和轴部酸痛。

技术分类

电信、广播电视和卫星传输服务电信、广播电视和卫星传输服务

互联网软件服务互联网软件服务

集成电路设计集成电路设计

信息集成数字服务信息集成数字服务

电气机械制造电气机械制造

计算机、通信、电子设备制造计算机、通信、电子设备制造

医药制造、生物基材料医药制造、生物基材料

石油煤矿化学用品加工石油煤矿化学用品加工

化学原料制品加工化学原料制品加工

非金属矿物加工非金属矿物加工

金属制品加工金属制品加工

专用设备制造专用设备制造

通用设备制造通用设备制造

通用零部件制造通用零部件制造

汽车制造业汽车制造业

铁路、船舶、航天设备制造铁路、船舶、航天设备制造

电力、热力生产和供应电力、热力生产和供应

燃气生产和供应燃气生产和供应

水生产和供应水生产和供应

房屋建筑、土木工程房屋建筑、土木工程

交通运输、仓储和邮政交通运输、仓储和邮政

农、林、牧、渔业农、林、牧、渔业

采矿业采矿业

农副、食品加工农副、食品加工

烟草、酒水加工烟草、酒水加工

纺织皮具居家制品纺织皮具居家制品

文教体娱加工文教体娱加工