深度学习模型优化技术及装置

123技术园

首页 / 技术内容

深度学习模型优化技术及装置

2025-02-07 21:23

No.1337534290044657664

技术概要

PDF全文

本技术方案涉及人工智能领域，具体为一种深度学习模型优化技术及装置。该技术通过训练数据构建并训练第一深度学习模型，进一步提取模型的自注意力机制特征，实现模型的高效压缩。

背景技术

近年来，随着算力的提升和算法的优化，深度神经网络在图像分类、自然语言处理、语音识别等领域取得了显著成果。然而，使用深度学习模型时常面临着庞大的参数和高计算需求，导致显存占用和计算延迟显著增加，特别是在资源受限的环境（如移动设备和边缘计算）中部署变得困难。相关技术中，模型轻量化技术主要通过减小神经网络模型的规模和降低计算复杂度，使得模型在有限资源的情况下实现高效推理和部署。当前技术主要通过网络剪枝、知识蒸馏等方法进行模型轻量化，但这些方法往往需要大量的计算资源和时间。此外，在高压缩比情况下，剪枝后的模型精度存在恢复效果不佳的问题，严重影响了模型的整体性能。因此，亟待设计一种技术方案，用于解决上述至少一个技术问题。

实现思路

阅读余下40%

技术概要为部分技术内容，查看PDF获取完整资料

该技术已申请专利，如用于商业用途，请联系技术所有人！

技术研发人员：

闯小明杨龚轶凡郑瀚寻潘维维

技术所属：中昊芯英（杭州）科技有限公司

相关技术

一种基于蚁群算法的跨境贸易供应链调度优化方法  一种基于蚁群算法的跨境贸易供应链调度优化方法 
 本发明涉及供应链规划技术领域，具体涉及一种基于蚁群算法的跨境贸易供应链调度优化方法。该方法首先根据公司节点对应初始的契合程度在所有初始的契合程度中突出情况，对初始的契合程度进行调整，获取调整后的契合程度；根据相邻公司节点组合的调整后的契合程度，对初始的交易质量参数进行调整，获取相邻公司节点组合的调整后的交易质量参数；根据每条供应链中相邻公司节点组合的调整后的交易质量参数，从供应链网络中所有供应链中筛选出最优的供应链。本发明通过深入分析运输成本和公司之间的契合程度，更好地筛选出最优的供应链，保障产品的供应过程的长期稳定的收益。
一种寒区刚性加铺复合道面结构适航性能评价方法  一种寒区刚性加铺复合道面结构适航性能评价方法 
 一种寒区刚性加铺复合道面结构适航性能评价方法。其包括土基含水率采集；对原道面板厚度进行修正；计算土基反应模量；确定标准机型；修正飞机荷载；计算道面板竖向变形量；检测实际变形量；计算道面疲劳系数；判断疲劳破坏状态；计算剪切变形量；计算层间结合系数；输出寒区机场的道面疲劳系数、层间结合系数及寒区机场跑道适航性能报告等步骤。本发明能够考虑寒区机场的特性与复合道面的特性，通过理论计算与实际检测相结合的方式，由变形量来表征跑道的适航性。另外，本方法还能够对相关人员提供寒区机场跑道适航性能报告，不仅有助于提升寒区机场的安全性和服务能力，而且能够为道面设计和维护提供数据支持。
基于气象模型预测机场航空排放物扩散的方法及装置  基于气象模型预测机场航空排放物扩散的方法及装置 
 本申请涉及环境影响评估技术领域，特别涉及一种基于气象模型预测机场航空排放物扩散的方法及装置，方法包括:获取目标机场的历史气象数据，并将历史气象数据进行预处理，得到满足预设条件的目标训练数据；利用目标训练数据对目标长短期记忆神经网络模型进行训练，以获得目标机场的气象模型；根据气象模型确定目标机场的目标关键气象数据，并输入至预先设置的大气污染物扩散模型中，以获得基于气象模型预测的机场航空排放物扩散结果。由此，解决了相关技术中的传统统计模型主要用于单变量时间序列预测任务，具有局限性，并且在预测工作前需要耗费大量精力进行数据分析工作，增加了气象预测的复杂性，降低了机场气象信息预测的精确性的问题。
基于KL散度和置换检验的概念漂移检测与解释方法  基于KL散度和置换检验的概念漂移检测与解释方法 
 本发明公开了一种基于KL散度和置换检验的异常检测与漂移解释方法，其实现步骤为:利用零阳性样本集训练自编码器；利用自编码器将待检测样本压缩成低维表示，利用孤立森林进行异常检测；系统关键事件发生后，计算事件样本与零阳性样本集的KL散度，并利用置换检验方法进行漂移检测；通过核密度估计方法估计样本的局部密度，确定漂移样本；通过孤立森林算法计算特征的重要性，从而解释漂移的成因；本发明解决了现有技术中漂移检测效率低、缺乏漂移解释的问题，提高了漂移检测的效率，并提供了漂移原因解释，可用于各类设备的实时异常检测和数据变化监控场景。
代码缺陷预测方法、可读存储介质、计算机程序产品  代码缺陷预测方法、可读存储介质、计算机程序产品 
 本公开实施例公开了一种代码缺陷预测方法、可读存储介质、计算机程序产品。其中，方法包括:构建多个预测模型和多个智能体；当代码库更新时，确定若干个更新项目，获取若干个更新项目的新版本代码；基于所述新版本代码和所述多个预测模型，获得若干个更新项目的潜在代码缺陷类型和潜在代码缺陷描述；基于所述潜在代码缺陷类型、所述潜在代码缺陷描述和所述多个智能体，生成若干个更新项目的缺陷报告；对所述缺陷报告进行真实性验证，在真实性验证通过后对所述新版本代码进行修复。该方法能够高效并准确的预测代码缺陷，并给出缺陷报告，用于修复相关缺陷，便于进行软件研发。
基于DQN算法的重型卡车电池系统智能决策方法及相关设备  基于DQN算法的重型卡车电池系统智能决策方法及相关设备 
 本发明公开了一种基于DQN算法的重型卡车电池系统智能决策方法及相关设备，首先分析了重型卡车电池系统的组成结构和运行能量流动关系，构建了详细的电池能耗计算模型；接着，从能耗计算模型中抽象出约束条件和优化目标，并将决策问题转化为马尔可夫决策过程；通过设计深度强化学习的状态、动作和奖励函数，构建了DQN模型，并利用历史数据进行训练，生成了能够根据当前状态选择最优动作的智能模型；系统实时获取电池的状态，并通过训练好的DQN模型计算最优动作，动态调整电池的能量分配和温度控制，从而实现能耗的最小化和系统性能的最优化。本发明能显著提升重型卡车的能源效率和系统性能，提高了车辆的整体运行效率和安全性。
一种基于引力交通模型的历史文化资源结构关系提取及可视化方法与系统  一种基于引力交通模型的历史文化资源结构关系提取及可视化方法与系统 
 本发明涉及信息提取与可视化领域，具体是一种基于引力交通模型的历史文化资源结构关系提取及可视化方法与系统。本发明通过对目标范围内的历史文化资源进行文本分析处理与地理空间分析，量化提取各历史文化资源的影响指数、两两间关联强度系数及最短路径距离。然后基于以上数据应用引力模型计算历史文化资源间的空间关联强度，并在数字化路网空间中进行分配，生成基于现实路网空间的历史文化资源空间结构的可视化成果。相较于既有分析方法，本发明有效提高了历史文化资源结构分析的科学性、准确性与客观性，具有广泛的应用前景与推广潜力。
一种超声内检测管道裂纹的三维数值模拟方法  一种超声内检测管道裂纹的三维数值模拟方法 
 本发明公开了一种超声内检测管道裂纹的三维数值模拟方法，该方法包括如下步骤:S1：根据超声传播过程建立三维几何模型；S2：添加各部分对应的材料属性；S3：使用压力声学、瞬态、固体力学、静电、电路设置传播过程及几何模型的边界条件；S4：使用多物理场声‑结构边界耦合液固边界，使用压电效应耦合静电和固体力学物理场；S5：在被测管道内部设置裂纹缺陷；S6：使用自由三角形、扫掠、自由四面体进行实体单元网格划分；S7：添加研究，设置求解器类型进行模拟计算。本发明可用于裂纹缺陷的超声内检测，推动了针对裂纹检测仅有二维平面模型检测的发展，可直观观测到超声波传播的过程。
一种重要性感知的大模型前缀KV重排方法和系统  一种重要性感知的大模型前缀KV重排方法和系统 
 本发明公开了一种重要性感知的大模型前缀KV重排方法和系统，包括:通过重要信息采集模块根据历史查询和前缀的计算结果，判断出基数树中每个节点内的所有token是否为重要的；通过前缀KV重排模块读取包含Imp序列的K或V的数据块到CPU内存中，然后将其中重要的token对应的K或V重新放置在一个数据块中，不重要的token对应的K或V放置在其他的数据块中；元数据更新模块根据重排后的token顺序，更新每个基数树节点中的序列，把重要的token放在前面，不重要的放在后面。本发明缓解了读放大问题，进一步减少磁盘的数据读取量；降低前缀KV复用时的加载时间，从而缩短大模型推理时产生第一个token的时间。
一种多模态信息映射的视觉语言模型窃取攻击方法及系统  一种多模态信息映射的视觉语言模型窃取攻击方法及系统 
 本发明公开了一种多模态信息映射的视觉语言模型窃取攻击方法及系统，该方法包括:基于第一数据集对第一视觉语言模型进行微调；选择初始替代模型；将第二数据集输入至目标模型和所述初始替代模型，反向传播图文映射联合损失函数，更新初始替代模型的参数，得到最终替代模型；将第三数据集输入至所述最终替代模型，计算最终替代模型的检索准确率。该系统包括：数据集划分模块、微调模块、预选模块、模型训练模块和检测模块。本发明能够在黑盒场景下有效窃取视觉语言模型的功能，并且不受训练数据集分布是否相同的影响，为研究视觉语言模型等多模态模型的潜在安全性及防御方法提供了新的思路和帮助。本发明可广泛应用于信息安全领域。

技术分类

电信、广播电视和卫星传输服务电信、广播电视和卫星传输服务

互联网软件服务互联网软件服务

集成电路设计集成电路设计

信息集成数字服务信息集成数字服务

电气机械制造电气机械制造

计算机、通信、电子设备制造计算机、通信、电子设备制造

医药制造、生物基材料医药制造、生物基材料

石油煤矿化学用品加工石油煤矿化学用品加工

化学原料制品加工化学原料制品加工

非金属矿物加工非金属矿物加工

金属制品加工金属制品加工

专用设备制造专用设备制造

通用设备制造通用设备制造

通用零部件制造通用零部件制造

汽车制造业汽车制造业

铁路、船舶、航天设备制造铁路、船舶、航天设备制造

电力、热力生产和供应电力、热力生产和供应

燃气生产和供应燃气生产和供应

水生产和供应水生产和供应

房屋建筑、土木工程房屋建筑、土木工程

交通运输、仓储和邮政交通运输、仓储和邮政

农、林、牧、渔业农、林、牧、渔业

采矿业采矿业

农副、食品加工农副、食品加工

烟草、酒水加工烟草、酒水加工

纺织皮具居家制品纺织皮具居家制品

文教体娱加工文教体娱加工