多特征融合优化的恶意软件分类技术

123技术园

首页 / 技术内容

多特征融合优化的恶意软件分类技术

2025-02-16 12:35

No.1340662821033353216

技术概要

PDF全文

本技术介绍了一种创新的恶意软件分类方法，该方法通过静态多特征优化与融合实现。首先，利用EfficientNet-B3模型对恶意软件图像进行特征提取。接着，结合IDA Pro和Radare2工具对软件进行逆向分析，以提取静态特征。通过特征优化和融合，提高恶意软件家族分类的准确性和效率。

背景技术

恶意软件防御领域第一阶段的检查工作，会对现实网络的海量样本进行初步筛查，得到的可疑样本还需要进行进一步的分析，即恶意软件防御工作的第二阶段任务，这个阶段的数据量也是十分可观的，仍然需要高效的方式来进行进一步的处理，在这个阶段中，恶意软件的家族分类是主流的研究方向。研究恶意软件家族分类对恶意软件防御领域具有重要的理论价值和现实意义。对于恶意软件检测，研究家族分类有助于揭示家族特征，使得识别未知的家族变体成为可能；另一方面，单纯检测和防范始终是被动的，为了更好地从根源上遏制恶意软件的发展，目前研究机构和安全公司都开展了恶意软件溯源的分析和研究工作，恶意软件家族分类是其中家族溯源的重要技术支撑。经过第一阶段的检测，识别出的可疑样本，通常主要包含以下三类情况：第一类是可以直接实现静态逆向分析的样本发明件。这是最理想的情况，这类恶意软件样本通常是普通的病毒、木马、蠕虫等，可能是未经过混淆、加密、加壳等操作的样本，也可能是使用常见的加壳、加密等技术进行保护，但是可以采用工具实现脱壳解密等操作，通过静态逆向分析可以获取其完整的汇编代码和功能。对于这类样本，采用静态分析能够获得程序的结构、语义、统计等各种类型的特征，这也一直是恶意软件分析中最流行、最有效的分析方法之一。因此对此类文件，研究基于静态分析特征的恶意软件智能家族分类方法具有重要的理论价值和现实意义。本发明的研究工作就是针对这类样本的家族分类展开，尤其着重于家族分类过程中的特征优化与融合筛选。家族变体是已知恶意软件经过功能或反检测技术的进化后生成的新型恶意软件，现有针对恶意软件变种的家族溯源工作一般都是通过提取其特征信息或部分原始代码，通过分析它们与已知家族样本发明件的相似性，实现可疑样本的家族溯源。现有研究中借助机器学习技术实现的智能分类工作近年来有所增加，这些工作中对特征的提取主要分为两类，一类是与传统检测工作类似，需要利用恶意软件的相关先验知识，通过静态或动态分析，提取出可读字符串、文件结构和函数调用图等特征。文献[Kinable,J.,＆amp;Kostakis,O.(2011).Malware classification based on call graph clustering[J].Journal inComputer Virology,7,233-245.]通过提取恶意软件样本的系统调用图，应用图匹配的方法分析恶意软件相似性，从而达到识别其家族同源性的目的。另一类研究工作则不依托恶意软件先验知识，直接利用机器学习方法实现家族分类。文献[Nataraj,L.,Karthikeyan,S.,Jacob,G.,＆amp;Manjunath,B.S.(2011).Malware images:visualization and automaticclassification[C].Visualization for Computer Security.]提出的将恶意软件直接转换为灰度图的方法，开启了学术界一个新的研究方向，后续研究都沿用了代码转换为灰度图这一思路，在其基础上进行了各种改进。有的研究对灰度图进行分割并使用灰度共生矩阵特征(Gray Level Cooccurrence Matrix，GLCM)，有的研究工作引入了信息熵的概念，提出了熵图的概念，通过比较图像的熵值来对恶意软件进行分类等等。这些工作都取得了一定的成绩，为恶意软件家族分类的研究做出了贡献，但仍然存在一些值得改进的问题：一方面，现有工作大部分还是采用了单一特征或者单一类型的特征，这就使得这些特征只能覆盖一部分恶意软件的特征信息，不能充分全面地表征原始样本所携带的信息，即存在一定的信息损失，从而导致最终的分类结果受到影响。另一方面，一些研究工作开始尝试多个特征的结合，但是大多以简单拼接的方式实现，没有对特征进行优化和选择，易导致特征维度过大，会引起训练时间开销的增加，且过多的特征冗余会分散有效特征对分类结果的影响权重，难以聚焦真正起作用的特征。

实现思路

阅读余下40%

技术概要为部分技术内容，查看PDF获取完整资料

该技术已申请专利，如用于商业用途，请联系技术所有人！

技术研发人员：

戚旭衍唐永鹤娄睿刘铁铭刘威朱兵侯一凡孙回回王淑亚张春艳

技术所属：中国人民解放军网络空间部队信息工程大学

相关技术

一种基于属性感知的Web网页信息抽取方法及装置  一种基于属性感知的Web网页信息抽取方法及装置 
 本发明公开一种基于属性感知的Web网页信息抽取方法及装置，属于网页信息抽取技术领域。包括:爬取给定目标网站的原始网页数据，将其保存下来作为模型的原始输入，在原始数据上对数据进行预处理，去除script等原始数据中无用的标签输入，减少输入模型的噪声信息；提取网页中的变量节点，构造输入模型的token序列和xpath序列，同时记录序列的位置信息，在预训练模型的基础上增加属性感知嵌入模块，使得预训练模型模型能够感知到性的模式信息，将输入信息的嵌入通过一个分类层，模型输出Web页面信息抽取的最终结果。该方法能够提高Web页面信息抽取的准确率，为下游任务提供丰富的结构化知识，促进下游任务的发展。
一种场景问答模型生成方法及装置  一种场景问答模型生成方法及装置 
 本发明提供一种场景问答模型生成方法及装置，涉及人工智能技术领域。所述方法包括:获取各个预设性格类型对应的多个样本问答对；针对每个所述预设性格类型，使用所多个样本问答对训练基础模型，得到预设性格类型对应的性格模型；利用性格模型生成场景问题对应的场景答复，并基于场景答复获取所述性格模型的偏好分数；基于每个性格模型的偏好分数，将所有性格模型融合为指定场景下的目标问答模型。本发明融合得到的目标问答模型在回答指定场景中的问题时，可给出更加符合用户偏好的回答，可有效提升问答模型在指定场景中的对话自然度。
社交媒体特征数据的预估方法及装置  社交媒体特征数据的预估方法及装置 
 本发明实施例中提供了一种社交媒体特征数据的预估方法、装置及电子设备，属于数据处理技术领域，该方法包括:对采集到的多个社交媒体数据进行数据清洗与格式化操作，得到标准数据；对构建的预测数据D={D1,D2,D3}按时间顺序整理，并将整理后的预测数据分割为训练集和测试集，使用训练集训练LSTM模型，通过调整权重和偏置项最小化预测误差，在训练完成后，将新的目标特征传播量数据输入LSTM模型，基于学习到的模式输出未来预设时间段内的目标特征传播量预测值D4；利用图表库生成目标特征传播量的趋势图、情感分析图和用户互动图。本发明提高了社交媒体特征数据预估的准确性。
一种基于数字孪生的双向DC/DC变换器状态监测方法  一种基于数字孪生的双向DC/DC变换器状态监测方法 
 本发明公开了一种基于数字孪生的双向DC/DC变换器状态监测方法。方法包括建立基于状态空间模型的数字孪生模型；采集双向DC/DC变换器实际运行时的电感电流和输出电压；根据实际运行时的电感电流和输出电压和电感初始值、电容初始值和电阻初始值，利用数字孪生模型，获得电感电流和输出电压的计算值；将实际值与计算值进行比较，计算模型误差；根据模型误差不断迭代更新双向DC/DC变换器的电感、电容和电阻；直至模型误差符合预设误差要求为止；将最后一次迭代更新的电感、电容和电阻，与正常情况下及各种故障情况下的电感、电容和电阻进行比较，实现了各元件状态的检测。本发明方案可实现双向DC/DC变换器各元件的故障检测。
基于模仿学习的驾驶培训教学方法及系统  基于模仿学习的驾驶培训教学方法及系统 
 本发明提供基于模仿学习的驾驶培训教学方法及系统，涉及智驾技术领域，包括获取多个人类驾驶员在多种驾驶场景下的驾驶行为示范数据，并提取所述驾驶行为示范数据中的驾驶行为特征；基于所述驾驶行为示范数据计算人类驾驶员的实际驾驶行为轨迹的第一特征期望；采用强化学习算法优化智能体的驾驶策略，通过所述智能体在模拟环境中执行所述驾驶策略得到智能体的模拟驾驶行为轨迹计算第二特征期望；通过最小化所述第一特征期望与所述第二特征期望之间的差异并且结合生成对抗网络交替优化更新所述隐含奖励函数的参数；将所述智能体驾驶策略用于所述智能体的辅助驾驶决策。
一种多参与方监理数据管理方法  一种多参与方监理数据管理方法 
 本发明具体涉及一种多参与方监理数据管理方法，包括步骤:为所有监理参与方创建分布式数字身份；定义监理数据的不同类别及其敏感级别；当某个监理参与方需要获取监理数据时，该参与方需向监理单位发起数据授权请求；监理单位接收到请求后，基于请求方的身份验证和数据访问规则，决定是否批准请求；如果请求被批准，监理单位将通过自己的身份私钥和请求方的分布式数字身份颁发一个可验证声明；施工单位在收到可验证声明后，将其连同数据获取请求一起发送给数据提供方；数据提供方接收到请求后，提取可验证声明中的信息；数据提供方使用请求方的身份公钥对可验证声明进行验签，确认无误后根据可验证声明中的授权范围提供相应的监理数据。
风电低出力事件判别及功率预测模型训练方法及装置  风电低出力事件判别及功率预测模型训练方法及装置 
 本公开提供了一种风电低出力事件判别及功率预测模型训练方法及装置，涉及风电功率预测技术领域，所述方法包括:对历史风电数据进行主成分分析，对主成分分析结果进行聚类，确定风电低出力事件对应的数据，构成样本集；对样本集中的至少一个气象要素和至少一个气象要素对应的风电功率点进行风电低出力事件类型的标注；基于样本集对风电低出力事件分类模型进行训练，基于样本集对不同风电低出力事件对应的风电低出力功率预测模型进行训练，如此，在后续功率预测场景中，可以根据不同风电低出力事件进行预测，增加风电功率短期功率预测的精度，提高风电功率预测结果对电力调度的积极意义。
一种基于贪心策略的抗社交网络用户身份关联方法  一种基于贪心策略的抗社交网络用户身份关联方法 
 本发明涉及社交网络分析技术领域，公开了一种基于贪心策略的抗社交网络用户身份关联方法。为了有效建模和求解抗社交网络用户身份关联问题并平衡成本与收益，提出了一种基于贪心策略的账号注入方案，将对用户身份关联模型的攻击问题建模为最大化确定的错误配对数量问题，让这些配对的相似度得分一定大于现有账号对之间的相似度得分，从而使对社交网络用户身份关联的攻击问题可解；基于贪心策略采用基于账号网络角色的脆弱性评估方法来识别脆弱性，实现从易到难的渐进式攻击；同时设计了一种基于贪心策略的注入策略搜索方法，用以确定应在注入账号和哪些现有账号之间发起好友连接，从而以低成本实现高效攻击。
直流变换器故障诊断方法、装置、设备、介质及程序产品  直流变换器故障诊断方法、装置、设备、介质及程序产品 
 本发明公开了一种直流变换器故障诊断方法、装置、设备、介质及程序产品，该方法包括:采集直流变换器的历史运行数据和故障样本数据，对历史运行数据和故障样本数据进行预处理，获得数据集，基于数据集构建核函数，构建原始模型，并基于核函数对原始模型进行训练和优化，获得故障诊断模型，原始模型包括支持向量机，采集直流变换器的实时运行数据，并对实时运行数据进行预处理，将预处理后的实时运行数据输入至故障诊断模型进行故障诊断，获得直流变换器的故障概率和故障类型，从而实现对直流变换器的运行状态进行监测，确保故障诊断时效性，有效地提升故障诊断的准确性，为故障处理提供可靠的诊断结果，提升故障处理的响应速度。
一种商业秘密保护泄密点分析的方法  一种商业秘密保护泄密点分析的方法 
 本发明公开了一种商业秘密保护泄密点分析的方法，包括如下步骤:调查得到每个部门员工涉及的数据资产；将数据资产的数据放入数据库；调查部门数据资产流转规则，将不同部门员工数据整合成基础的数据表，对每个数据表加标签，并对数据做替换处理；根据流转规则对数据表做关联处理得到不同的数据关联表；将不同的数据关联表的数据提取，与各个秘密保护单元做差异分析；做出泄密点分析报告；通过本发明的分析方法，借助常规的工具，可将众多隐藏在貌似合理的业务流程中的泄密风险点挖掘出来，做到全面的商业秘密保护工作；通过数据替换，借助常规分析工具的同时能做到分析处理过程中商业秘密的防泄漏性。

技术分类

电信、广播电视和卫星传输服务电信、广播电视和卫星传输服务

互联网软件服务互联网软件服务

集成电路设计集成电路设计

信息集成数字服务信息集成数字服务

电气机械制造电气机械制造

计算机、通信、电子设备制造计算机、通信、电子设备制造

医药制造、生物基材料医药制造、生物基材料

石油煤矿化学用品加工石油煤矿化学用品加工

化学原料制品加工化学原料制品加工

非金属矿物加工非金属矿物加工

金属制品加工金属制品加工

专用设备制造专用设备制造

通用设备制造通用设备制造

通用零部件制造通用零部件制造

汽车制造业汽车制造业

铁路、船舶、航天设备制造铁路、船舶、航天设备制造

电力、热力生产和供应电力、热力生产和供应

燃气生产和供应燃气生产和供应

水生产和供应水生产和供应

房屋建筑、土木工程房屋建筑、土木工程

交通运输、仓储和邮政交通运输、仓储和邮政

农、林、牧、渔业农、林、牧、渔业

采矿业采矿业

农副、食品加工农副、食品加工

烟草、酒水加工烟草、酒水加工

纺织皮具居家制品纺织皮具居家制品

文教体娱加工文教体娱加工