模型训练方法、装置、电子设备及计算机可读存储介质

123技术园

首页 / 技术内容

2025-02-24 09:06

No.1343509442263785472

技术概要

PDF全文

本申请提供一种模型训练方法、装置、电子设备及计算机可读存储介质，方法包括:获取对于原始模型在本轮训练中得到的模型参数；对模型参数进行量化，得到量化参数；将并行模型的模型参数更新为量化参数，并将原始模型在本轮训练中的输入数据，输入至并行模型中进行训练；其中，并行模型与原始模型的模型结构一致；根据原始模型在本轮训练中的损失值，和并行模型在本轮训练中的损失值，确定出本轮训练的综合损失值；在综合损失值不满足预设结束条件时，对原始模型的模型参数进行更新。该方案在训练过程中考虑了模型参数被量化后所产生的损失，使得最终训练得到的模型在被量化后，其损失也在可接受范围内，从而降低了模型量化后的精度损失。

背景技术

随着AI(Artificial Intelligence，人工智能)技术的不断发展，深度神经网络也被不断应用于诸如人脸识别、智能导航、智能问诊、远程通信等等场景中。为了满足各种AI应用场景对检测精度的要求，深度神经网络结构的宽度、层数、深度以及各类参数等数量急速上升，导致深度学习模型对于空间的需求变大，推理效率变低。同时商业对模型应用越来越倾向于从云端部署到边缘侧，受限于边缘侧设备的计算资源，需要考虑设备存储、内存、功耗及时延性等问题，特别是在移动终端和嵌入式设备等应用场景更加需要优化。作为通用的深度学习优化的手段之一，模型量化将深度学习模型量化为更小的定点模型和更快的推理速度，其适用于绝大数模型和使用场景。模型量化以损失推理精度为代价，将网络中连续取值或离散取值的浮点型参数(权重或张量)线性映射为定点近似的离散值，取代原有的float32格式数据，同时保持输入输出为浮点型，从而达到减少模型尺寸大小、减少模型内存消耗及加快模型推理速度等目标。但是，目前的量化方式是直接对训练得到的模型进行量化。通过将模型的模型参数从fp32进行同分布转换到fp16，或者通过预先准备的数据集，结合权重值分布将fp32的模型转换到int8，实现模型量化。但是，目前直接对训练得到的模型进行量化后，会存在一定程度上的精度损失。

实现思路

阅读余下40%

技术概要为部分技术内容，查看PDF获取完整资料

该技术已申请专利，如用于商业用途，请联系技术所有人！

技术研发人员：

吴建兵沈成赵斌白冰

技术所属：光子算数(北京)科技有限责任公司.

相关技术

基于数字孪生的航空涡轮叶片服役损伤监测方法  基于数字孪生的航空涡轮叶片服役损伤监测方法 
 本发明涉及基于数字孪生的航空涡轮叶片服役损伤监测方法，属于航空发动机技术领域，解决了现有检测算法计算复杂度高、效率和精度较低的问题。确定待监测的涡轮叶片物理实体，采集涡轮叶片环境信息；以物理实体为基础构建数字孪生体，其中涡轮叶片三维模型构建模块根据物理实体构建涡轮叶片三维模型，涡轮叶片运行环境模拟模块依据涡轮叶片实时的载荷、旋转速度及所处环境温度数据对模型进行环境模拟，涡轮叶片缺陷演化预测模块利用智能缺陷检测算法识别模型每一时刻叶片表面缺陷，得到缺陷的类别和位置信息及尺寸信息，还进行演化模拟和危险系数分析。本发明实现了对航空涡轮叶片表面缺陷的实时在线、高精度、高效率检测，提高涡轮叶片使用寿命。
一种基于统计控制的联邦学习恶意参与方检测方法及系统  一种基于统计控制的联邦学习恶意参与方检测方法及系统 
 本发明公开了基于统计控制的联邦学习恶意参与方检测方法及系统，方法如下:S1、服务器向参与方发送训练任务及初始化模型参数；S2、参与方下载当前全局模型，进行本地训练，得到局部模型并上传；S3、服务器接收局部模型并进行聚合，得到新全局模型；S4、当联邦学习轮次小于T＆lt;subgt;g＆lt;/subgt;时，服务器计算上传模型的参数向量到全局模型的欧式距离平方，并对所有距离值进行建模，选择诚实参与方进行模型聚合；S5、当轮次等于T＆lt;subgt;g＆lt;/subgt;时，服务器构建控制限；S6、当轮次大于T＆lt;subgt;g＆lt;/subgt;时，服务器计算参与方上传模型与全局模型的距离，通过控制限，区分恶意与诚实参与方；S7、服务器聚合诚实参与方的模型得到新全局模型，发给所有参与方；S8、返回S2，直至达到预设目标。
一种基于改进深度学习模型的洪灾水体智能识别方法  一种基于改进深度学习模型的洪灾水体智能识别方法 
 本发明公开了一种基于改进深度学习模型的洪灾水体智能识别方法，属于地质灾害信息处理技术领域，包括以下步骤:数据收集与预处理，生成数据集；基于生成的数据集，集成Canny边缘检测算子、归一化水体指数、局部二值模式LBP算子纹理形成多特征融合图数据集；构建DeepWFNet网络模型；将多特征融合图数据集输入DeepWFNet网络模型进行洪水淹没范围识别，得到洪水识别结果；对洪水识别结果进行可视化优化与评估。本发明通过加入边缘特征、光谱特征、纹理特征与DeepWFNet模型相结合，可以在保持局部特征提取能力的同时，增强模型对全局信息的理解能力，从而显著提高对洪水淹没区域的分割精度。
一种基于实际车流荷载的桥梁限载确定方法、系统及介质  一种基于实际车流荷载的桥梁限载确定方法、系统及介质 
 本发明公开了一种基于实际车流荷载的桥梁限载确定方法、系统及存储介质，涉及桥梁承载能力评估技术领域，包括步骤:采集通行车辆特征信息；利用通行车辆特征信息、动态称重模型获取假定桥梁应变数据确定推定车辆行驶信息；获取实际通行车辆信息；建立真实车流荷载数字模型；生成测试模拟车流，并获取测试模拟车流中超载车辆的超载违规率；使用影响面加载的方式获取桥梁的测试应变历程；计算等效应力幅值和平均应力值；进行疲劳寿命计算。本发明的方法，计算机识别设备仅仅用于获取摄车辆车型和拍摄识别车轴数，避免了现有的由计算机视觉系统采集车辆位置信息导致不精确、车轴信息存在假轴的缺点，能准确地评估桥梁荷载载荷。
一种基于垂向偏差模型的HSRL海水后向散射反演方法  一种基于垂向偏差模型的HSRL海水后向散射反演方法 
 本发明公开了一种基于垂向偏差模型的HSRL海水后向散射反演方法，包括:获取HSRL系统仿真的颗粒散射信号和分子散射信号；计算HSRL直接探测到的后向散射，并根据仿真输入的后向散射真值计算后向散射垂向偏差；根据系统参数、环境参数以及后向散射垂向偏差，得到垂向偏差模型；对近水面数据进行处理，计算不受多次散射影响的后向散射近水面值，并结合颗粒物后向散射比估算散射系数近水面值；基于垂向偏差模型，计算不同深度的垂向偏差；根据得到的垂向偏差剖面反演后向散射剖面。本发明克服了多次散射导致的HSRL海水后向散射反演误差，显著提高了海洋HSRL的探测精度。
一种基于FPGA的神经网络存算资源优化分配方法及系统  一种基于FPGA的神经网络存算资源优化分配方法及系统 
 本发明提出了一种基于FPGA的神经网络存算资源优化分配方法及系统，涉及人工智能技术领域，包括:分析并行因子与神经网络各层的延迟、并行因子与FPGA的计算资源消耗，建立层间计算资源关系模型；基于层间计算资源关系模型，通过计算资源分配方法，得到分配后的神经网络各层的最佳并行因子；分析神经网络层内各模块的延迟与并行度、内存资源消耗，建立层内内存资源关系模型；基于层间计算资源关系模型及层内内存资源关系模型和分配后的神经网络各层的最佳并行因子，实现层内内存资源与延迟的平衡优化。本发明通过合理分配各层并行度，在最小资源占用的前提下减少数据流阻塞，以各层内模块延迟一致与各层间延迟一致为目标，实现总延迟最小的效果。
一种远程互动教研平台终端  一种远程互动教研平台终端 
 本发明公开了一种远程互动教研平台终端，涉及远程教育技术领域，包括监控中心，所述监控中心连接有登录显示模块、教研采集模块、资料处理模块、多源分析模块以及自主学习模块；对教学资料数据进行排列分类，获得公开编码符和封闭编码符；根据公开编码符对教研编码段进行显性加密和学习检索，获得综合学习序列，通过封闭编码符对综合学习序列进行保护解除，获得开放学习序列；对开放学习序列进行规则生成，获得限制节点规则，通过限制节点规则对开放学习序列进行监测学习，获得远程调研成果；简化操作流程，增强参与感和体验，提升终端的整体性能和稳定性，提高互动效率。
一种河流径流还原方法及系统  一种河流径流还原方法及系统 
 本发明公开一种河流径流还原方法及系统，涉及水文水资源领域。该方法包括:从目标流域的多个邻近天然流域中确定最优邻近天然流域；计算目标流域在水库建成前和水库建成后的预设时间段内每日的径流量比的第一变化率；计算最优邻近天然流域在水库建成前和水库建成后的预设时间段内每日的径流量比的第二变化率；根据目标流域在水库建成后的预设监测时间段内每个日期的日径流量和对应日期的第一变化率、第二变化率，确定目标流域还原自然变化特征后在预设监测时间段内每个日期的日径流量；根据每年的年径流量变化率，得到目标流域在每年的预设监测时间段内还原后的每个日期的日径流量。本发明能够提高水库调节后的径流还原成天然径流的精度。
一种兼容CHI协议的芯粒互联接口协议层电路及芯片  一种兼容CHI协议的芯粒互联接口协议层电路及芯片 
 本发明公开了一种兼容CHI协议的芯粒互联接口协议层电路及芯片，本发明的芯粒互联接口协议层电路包括与适配器层和物理层相连接的协议层中的发送单元和接收单元，发送单元包括依次相连的发送端虚通道管理模块、发送缓冲单元和打包模块，发送缓冲单元用于缓存各个通道的微包且分别包括并行的请求‑监听发送缓冲、响应发送缓冲、调测试发送缓冲和数据发送缓冲，接收单元包括依次相连的解析模块、接收缓冲单元和接收端虚通道管理模块，所述接收缓冲单元包括并行的请求‑监听接收缓冲、响应接收缓冲、调测试接收缓冲和数据接收缓冲。本发明旨在使得芯粒互联接口可以兼容CHI协议，使得ARM架构实现的芯粒可以通过CHI协议实现一致性互联。
一种岛礁建筑群受打击后毁伤程度预测方法  一种岛礁建筑群受打击后毁伤程度预测方法 
 本发明涉及一种岛礁建筑群受打击后毁伤程度预测方法，包括如下步骤:将岛礁建筑群划分为n个建筑样本，对每个建筑样本分配不同的毁伤评估权重；筛选影响岛礁建筑群毁伤程度的随机变量，确定随机变量的相关参数；建立岛礁建筑群毁伤模型；基于随机抽样法生成随机变量的m组数据，并将m组数据输入岛礁建筑群毁伤模型进行毁伤模拟，获取每个建筑样本的毁伤数据；设定毁伤阈值，判断每个建筑样本的毁伤数据是否达到毁伤阈值，确定每个建筑样本的毁伤失效率；确定岛礁建筑群平均毁伤目标数。本发明能够对深海岛礁建筑群抗蓄意打击能力和毁伤程度进行韧性评估，考虑了其复杂环境的不确定性数据边界，为深海岛礁的防护等级确定提供科学数据和信息依据。

技术分类

电信、广播电视和卫星传输服务电信、广播电视和卫星传输服务

互联网软件服务互联网软件服务

集成电路设计集成电路设计

信息集成数字服务信息集成数字服务

电气机械制造电气机械制造

计算机、通信、电子设备制造计算机、通信、电子设备制造

医药制造、生物基材料医药制造、生物基材料

石油煤矿化学用品加工石油煤矿化学用品加工

化学原料制品加工化学原料制品加工

非金属矿物加工非金属矿物加工

金属制品加工金属制品加工

专用设备制造专用设备制造

通用设备制造通用设备制造

通用零部件制造通用零部件制造

汽车制造业汽车制造业

铁路、船舶、航天设备制造铁路、船舶、航天设备制造

电力、热力生产和供应电力、热力生产和供应

燃气生产和供应燃气生产和供应

水生产和供应水生产和供应

房屋建筑、土木工程房屋建筑、土木工程

交通运输、仓储和邮政交通运输、仓储和邮政

农、林、牧、渔业农、林、牧、渔业

采矿业采矿业

农副、食品加工农副、食品加工

烟草、酒水加工烟草、酒水加工

纺织皮具居家制品纺织皮具居家制品

文教体娱加工文教体娱加工