多源数据隐私保护逻辑回归训练系统

123技术园

首页 / 技术内容

多源数据隐私保护逻辑回归训练系统

2025-02-16 11:25

No.1340645505226776576

技术概要

PDF全文

本技术涉及信息安全技术，提供了一种在保护用户数据隐私的基础上进行逻辑回归训练的方法及系统。该方法采用非交互式联邦学习技术，实现多源垂直分布数据的安全训练。

背景技术

随着大数据时代的到来，大规模的数据收集提高了机器学习算法的性能，也不断推动着人工智能技术的进步。然而，在大量的人工智能产品背后，用户个人敏感数据的隐私保护也面临着更大的风险与挑战。为了更好的保护用户个人隐私数据的安全，联邦学习的训练模式应运而生，和传统集中训练模式的机器学习方式相比，联邦学习实现了将各方原始数据保留在本地的同时进行机器学习训练，能够有效帮助多个机构在满足数据安全的前提下，搭建共享的高性能模型，而且最大化地利用了云系统终端设备的高计算能力。联邦学习的出现有效解决了数据孤岛的问题，帮助多参与方在不共享原始数据的基础上实现协作建模。传统的联邦学习训练通常采用的方式是用户利用本地数据进行模型训练，然后将模型梯度发送至云端并进行全局模型的聚合并更新模型参数，最后由云将聚合的结果发送给参与方更新各自的模型。采用传统联邦学习模式要求用户在训练过程中一直保持在线，且需要消耗大量计算资源进行模型训练。同时，这种模式并没有对模型的梯度参数进行加密，也在一定程度上存在隐私数据泄露的风险。具体来说，如深圳前海微众银行股份有限公司的专利“提升安全性的纵向联邦学习方法、设备、系统及存储介质”(申请号CN201911128849.6申请公布号CN110704860A)，公开了一种安全联邦学习逻辑回归算法，在联合第三方进行纵向联邦逻辑回归建模的方案中，避免第三方联合其中一方窃取数据的可能性，在一定程度上提高了逻辑回归模型的安全性。但是，该方法的不足之处在于训练过程需要参与用户一直保持在现，且每轮迭代都需要进行数据拥有者和云服务器之间的通信，增加了通信开销。通过上述分析，现有技术存在的问题及缺陷为： (1)传统的联邦学习训练方法，在训练过程中每次迭代都要参与方上传本地模型的梯度参数，而又并未对本地训练模型的梯度参数进行加密保护，在一定程度上存在隐私数据泄露的问题。 (2)传统的联邦学习训练方法一般针对于交互式计算场景，在整个训练过程中需要保持所有训练参与方实时在线，且需要消耗大量的计算资源进行模型的训练。 (3)传统联邦学习训练方法，训练模型的每次迭代都需要在参与方和云服务器之间进行大量密文的通信，通信开销较大。解决以上问题及缺陷的难度为： (1)为了防止训练过程中梯度参数泄露用户隐私的问题，需要对梯度参数利用密码学方法进行加密保护，多用户与云服务器多轮通信中，计算开销和密文尺寸增大所带来的通信开销降低了模型的可用性和效率。 (2)在联邦学习训练的非交互式场景下，现有的同态加密算法难以得到有效运用，不能为多源用户提供有效的隐私保护。 (3)传统联邦学习的迭代训练过程中，利用密码学原语对用户上传的模型参数进行加密保护会带来了极大的通信开销，存在安全性与可用性相互制约的问题。解决以上问题及缺陷的意义为：针对分布式场景下，设计一种非交互式联邦学习逻辑回归问题的解决方案，能够有效解决多源数据协同训练过程中个人用户隐私信息泄露的问题，确保多数据源用户协同训练过程中敏感信息的安全性，推动联邦学习及大数据安全相关技术的发展。

实现思路

阅读余下40%

技术概要为部分技术内容，查看PDF获取完整资料

该技术已申请专利，如用于商业用途，请联系技术所有人！

技术研发人员：

朱辉李临风沈洁赵家奇王枫为魏立力王二梅

技术所属：西安电子科技大学中移(苏州)软件技术有限公司.

相关技术

基于流程模拟软件自定义模块的流程模拟方法、装置、平台、介质及产品  基于流程模拟软件自定义模块的流程模拟方法、装置、平台、介质及产品 
 本发明公开了一种基于流程模拟软件自定义模块的流程模拟方法、装置、平台、介质及产品。所述方法包括:响应于流程模拟事件被触发，获取流程模拟自定义脚本；其中，所述流程模拟自定义脚本为用户在所述流程模拟软件的自定义模块中编写的流程模拟脚本；判断所述流程模拟软件中是否存储有与所述流程模拟自定义脚本对应的CPU控制指令；若所述流程模拟软件中存储有与所述流程模拟自定义脚本对应的CPU控制指令，则调用所述CPU控制指令，生成流程模拟结果。本方案在基于流程模拟软件进行流程模拟时，可有效提升代码的执行性能，快速获取流程模拟结果。
气动进给清灰装备控制方法及系统  气动进给清灰装备控制方法及系统 
 本发明涉及数据处理技术领域，本发明涉及气动进给清灰装备控制方法，包括:首先，通过获取气动进给清灰装备中多个锯齿在不同时刻下的扭矩数据，并将同一时刻下多个锯齿的扭矩数据组合为一个扭矩序列，从而形成第一扭矩序列组；接着，计算当前扭矩序列与下一扭矩序列之间的关联度，利用皮尔逊相关系数及扭矩的最大最小值的乘积进行分析；若关联度低于设定关联度阈值，则剔除对应的扭矩序列，获得第二扭矩序列组；然后，针对第二扭矩序列组计算异常值，当异常值超过异常阈值时，系统将自动触发最大气动功率进行清灰。本发明解决了面对复杂操作环境下清灰效果不佳的问题。
一种基于自学习的数据挖掘方法及系统  一种基于自学习的数据挖掘方法及系统 
 本发明公开了一种基于自学习的数据挖掘方法及系统，收集不同生鲜产品在各个新鲜度阶段的时间序列图像数据，从中提取出静态特征和动态特征，通过分析这些特征，定义标签，该标签将静态特征与动态特征关联起来，以形成一个综合性的描述；根据动态特征的变化规律，将具有相似变化模式的产品归入同一相似组；在此基础上，利用这些标签和相似组数据训练自学习挖掘模型，专注于提升对相似组产品的识别能力；将挖掘结果反馈至系统的动态时空图中，实现对图中节点属性的更新，从而持续优化识别算法。本发明不仅能够有效克服动态特征变化带来的识别难题，还能通过静态特征提供稳定的识别基准，进而显著提升生鲜产品在不同新鲜度下识别的准确性和可靠性。
一种基于商密SM9的前向安全标识签名方法  一种基于商密SM9的前向安全标识签名方法 
 本发明公开了一种基于商密SM9的前向安全标识签名方法，包括密钥生成中心、签名者、验证者。密钥生成中心跟签名者、验证者之间是完全信任的。其中密钥生成中心初始化系统参数，并根据用户标识ID为签名者颁发初始密钥。签名者向密钥生成中心发出密钥更新请求，从而获得更新后的密钥。签名者输入系统主公钥、消息以及t时段下的密钥执行签名算法生成消息签名，并将消息、签名以及自身的用户标识ID发送给验证者。验证者输入系统主公钥以及接收到的参数执行签名验证算法，验证成功则输出1，验证失败则输出0。本发明通过引入密钥更新机制，即使在私钥泄露的情况下，也能确保过去生成的签名不被伪造的签名机制。
面向深度强化学习的电网运行环境推演方法  面向深度强化学习的电网运行环境推演方法 
 本发明提供一种面向深度强化学习的电网运行环境推演方法，涉及数据处理技术领域，基于电网中设备的属性对电网运行环境进行分类得到发电侧设备、储电侧设备以及用电侧设备；根据各设备的历史电力数据进行深度学习训练，分别得到发电子神经网络、储电子神经网络以及用电子神经网络；根据发电侧设备、储电侧设备以及用电侧设备的数据关联关系对发电子神经网络、储电子神经网络以及用电子神经网络组装，得到总神经推演网络；获取推演目标所对应的变量推演参数输入至总神经推演网络得到预测推演结果；将预测推演结果与实际发生结果比对得到多维度训练数据，基于多维度训练数据对总神经推演网络中神经元的权重以及激励函数训练更新处理。
一种基于知识图谱的多模态习题表征方法  一种基于知识图谱的多模态习题表征方法 
 本发明公开了一种基于知识图谱的多模态习题表征方法，涉及多模态表征技术领域，包括:获取多模态信息的数学习题信息以及相关知识点，提取多模态习题涉及的所有元素；提取多模态习题的图像和文本特征；基于表层理解规则，明确习题文本和图片中各元素之间的空间关系，并构建表示表层信息的知识图谱；基于隐层理解的规则，将习题涉及的相关定理和公式转化为形式化语言，并构建表示隐层信息的知识图谱；将表示表层信息和表示隐层信息的知识图谱融合为表示完整的习题信息的知识图谱；基于表示不同习题信息的知识图谱节点和边，计算习题之间的相似度和困难度及文本知识图谱和图像知识图谱的匹配度；基于自动解题模型，获得习题的深度表征。
一种非结构化文本类信息融合方法及装置  一种非结构化文本类信息融合方法及装置 
 本申请公开了一种非结构化文本类信息融合方法及装置，方法包括首先对不同格式的文本信息中的各种信息标签进行提取，提取出对应的键值对标签；根据标签对文本信息进行信息提取，并将提取出来的信息存表落库；将根据信息不同划分为多个不同的数据流，然后进行标准化、进行修复和规则转换，重新融合到标准数据流中；从每个数据源中提取主键ID信息，并根据主键ID信息建立每个数据源之间的关联性。最后建立每个信息源的主键关联性，同时设置不同数据源的信息使用优先级，将多个数据源形成为统一整体。可以高效的完成对多个存在较大的关联性的文本数据源的融合，融合后生成一个标准化好的新数据源。
基于生成对抗网络数据解耦的数据平衡去毒方法  基于生成对抗网络数据解耦的数据平衡去毒方法 
 本发明涉及机器学习领域，具体为基于生成对抗网络数据解耦的数据平衡去毒方法，对数据集进行降维映射和聚类分析，得到若干数据聚类；对每个数据聚类加入对抗扰动，生成对抗数据聚类；对每个对抗数据聚类进行转移率计算和中毒样本去除，得到去毒数据聚类，并将所有去毒数据聚类组合为去毒数据集；对去毒数据集进行数据解耦和平衡处理，得到平衡数据集；基于平衡数据集，对待去毒模型进行微调训练，从而得到去毒模型。本发明能够减少训练数据的中毒样本，避免模型训练过程中学习拟合后门触发器的特征，提高模型后门攻击防御效果的稳定性和模型在实际应用中的可靠性。
一种地脚螺栓防松设计方法及系统  一种地脚螺栓防松设计方法及系统 
 本发明涉及多目标优化控制技术领域，公开了一种地脚螺栓防松设计方法及系统，包括提取地脚螺栓的基础尺寸参数，基于基础尺寸参数构建螺栓初始实体模型；提取地脚螺栓的精细几何参数，生成带有精细螺纹特征的完整螺栓实体模型；对螺栓实体模型划分有限元网格，生成有限元模型；构建防松性能目标函数和重量目标函数，建立多目标优化模型，并求解得到最优解；收集常用金属的物理力学性能数据，搜索最优材料组合，生成地脚螺栓的优化模型；通过优化迭代循环，直至多目标优化模型的函数值达到收敛条件，输出最终的防松地脚螺栓设计方案。本发明提供了一种高效、精确的地脚螺栓防松方案，实现了防松性能和重量的优化平衡。
一种弹性组合定步长仿真方法及系统  一种弹性组合定步长仿真方法及系统 
 本申请提供了一种弹性组合定步长仿真方法及系统，涉及工业互联网数值仿真计算领域，方法包括:获取信息物理系统模型；将信息物理系统模型编译成标准状态方程形式的数学模型；设置定步长仿真算法；设置基础仿真步长；设置仿真采用的定步长模式；定步长模式包括：分时段自定义步长模式和自适应步长模式；通过设置的定步长仿真算法、基础仿真步长以及定步长模式，生成仿真配置文件；通过仿真配置文件、结合数学模型，执行单步积分，完成仿真。本申请的技术方案可支持，分时段跨区间自定义步长离线仿真，同时支持基于事件触发的自适应定步长在线仿真。

技术分类

电信、广播电视和卫星传输服务电信、广播电视和卫星传输服务

互联网软件服务互联网软件服务

集成电路设计集成电路设计

信息集成数字服务信息集成数字服务

电气机械制造电气机械制造

计算机、通信、电子设备制造计算机、通信、电子设备制造

医药制造、生物基材料医药制造、生物基材料

石油煤矿化学用品加工石油煤矿化学用品加工

化学原料制品加工化学原料制品加工

非金属矿物加工非金属矿物加工

金属制品加工金属制品加工

专用设备制造专用设备制造

通用设备制造通用设备制造

通用零部件制造通用零部件制造

汽车制造业汽车制造业

铁路、船舶、航天设备制造铁路、船舶、航天设备制造

电力、热力生产和供应电力、热力生产和供应

燃气生产和供应燃气生产和供应

水生产和供应水生产和供应

房屋建筑、土木工程房屋建筑、土木工程

交通运输、仓储和邮政交通运输、仓储和邮政

农、林、牧、渔业农、林、牧、渔业

采矿业采矿业

农副、食品加工农副、食品加工

烟草、酒水加工烟草、酒水加工

纺织皮具居家制品纺织皮具居家制品

文教体娱加工文教体娱加工