优化CSR算法以加速大型复数稀疏矩阵计算

123技术园

首页 / 技术内容

2025-02-09 20:23

No.1338243920089587712

技术概要

PDF全文

本技术涉及一种优化的数据处理方法，旨在加速大型复数稀疏矩阵的计算过程，特别适用于电磁计算等领域中的大规模复数稀疏矩阵方程组的迭代求解。该方法通过微分方程法对物理模型进行处理，以提高计算效率。

背景技术

电磁场基础的工业技术在人类现代文明的发展中起到了及其关键的推动作用，并且在未来也将是重要的基础技术。近年来，我国在与电磁密切相关的领域取得了一系列重要进展，如空中预警指挥飞机成功服役、深地和海洋矿产资源探测等。一般来说，常用的电磁场数值计算方法可以分为两大类：一类是基于微分方程的解法；另一类是基于积分方程的解法。其中基于有限单元法、有限差分法、有限体积法等微分方程法的电磁计算，通常最后都需要求解大型复数稀疏矩阵方程组，而求解方程组的过程通常又占据了整个计算流程90％以上的时间。当前多核处理器为了适用于多媒体音频、图像处理等领域的应用都扩展了向量寄存器体系结构，例如X86的AVX架构，ARM的NEON架构等。向量寄存器的原理是SIMD(SingleInstruction Multiple Data，单指令多数据流)，旨在利用一条指令同时处理多个数据，像ARMv8架构里面的fmal乘加指令、fadd加法指令等，X86体系里面也有类似的指令。ARMv8架构中向量寄存器有128位大小，可以存储2位double类型的数据或者4位float类型的数据。此处简单介绍一下向量寄存的工作过程，如图1所示，v1、v2、v3为128位向量寄存器，其中存放两个数组a和b，现在要使得a，b两个数组对应元素相乘，普通的乘法指令需要调用4次才能够实现这个过程(如图1所示)，而向量化指令则只需要一条fmul相乘指令就能够完成任务，如图2所示。由此可见当处理的数据能够形成规模并且对齐，那么SIMD技术能够大大提升计算速度。一般而言，大型复数稀疏矩阵都会采用CSR、COO、SELL等压缩存储格式进行存储以节省空间，SPMV运算是计算访存密集型操作，但这些存储格式使得方程组在访问内存上不连续，尤其是x向量的访问。这导致了在计算大型复数稀疏矩阵方程组时会有大量的高速缓存缺失情况，从而无法充分利用好向量加速硬件的性能，增加了访存开销从而拖慢整体运行速度。

实现思路

阅读余下40%

技术概要为部分技术内容，查看PDF获取完整资料

该技术已申请专利，如用于商业用途，请联系技术所有人！

技术研发人员：

龚春叶程旭肖调杰杨博刘杰甘新标李胜国陈旭光陈新海张庆阳

技术所属：中国人民解放军国防科技大学

相关技术

一种基于医院场景识别的电子签章自动推荐方法  一种基于医院场景识别的电子签章自动推荐方法 
 本发明的目的是提供一种基于医院场景识别的电子签章自动推荐方法，该方法包括:采用管理者私钥将业务操作信息加密得到业务操作数据块；将业务操作数据块上传至区块链；通过哈希算法将业务操作信息中的场景数据处理得到场景摘要，将所述场景摘要上传至区块链；在签章者接收到签章通知后，通过属性私钥获取场景摘要；根据场景摘要和签章者的个人电子印章生成业务操作印章；根据业务操作印章生成签章结果；管理者收到签章结果后对业务操作印章进行验证。本发明能够大大提高数据传输的安全性，通过使用电子签章，各医疗机构可以轻松验证数据的来源，确保所使用的是真实、准确且没有被篡改的数据，也在很大程度上提升了医疗服务和管理水平。
一种支持动态陷门的可编辑区块链方法  一种支持动态陷门的可编辑区块链方法 
 本发明公开了一种支持动态陷门的可编辑区块链方法；该方法包括:公共参数生成、主陷门密钥对生成、用户密钥生成、变色龙哈希值生成、查找碰撞、用户密钥与哈希验证、陷门废除与更新和陷门更新验证。本发明采用了一种支持动态陷门的变色龙哈希，在突破区块链的固有不可篡改性时，能够实现陷门的动态更新，只有拥有合法陷门密钥的用户才能够对已上链数据进行更改，降低了恶意节点长期持有陷门的风险。相关安全性测试结果表明，本发明在安全性方面具有优势，以较小的计算代价实现了更高的安全性保证，提高了陷门私钥的动态时效性，实现了区块链的可编辑性和安全可信性的有机融合。
一种基于序列补全策略的电离层参数预测方法及装置  一种基于序列补全策略的电离层参数预测方法及装置 
 本申请公开了一种基于序列补全策略的电离层参数预测方法及装置，涉及电离层参数预测技术领域，该方法包括:通过将历史电离层序列数据采用多种信号分解算法进行信号分解，得到子分量，基于子分量与历史电离层序列数据进行对比分析，得到损失分量，基于子分量，确定误差损失项，并根据损失分量和误差损失项进行信号补全，得到补全分量；将补全分量和子分量分别作为预测分量输入到预设深度学习神经网络中，得到预测结果。本发明解决了传统方法忽视了信号分解算法中存在的信号损失问题，将分解过程中产生的误差信号转换为有效信号的形式，同时采用神经网络处理方法可以大大提高预测结果的准确性和有效性。
一种基于多场景实体的数字红包发送方法及系统  一种基于多场景实体的数字红包发送方法及系统 
 本发明实施例涉及网络营销技术领域，具体公开了一种基于多场景实体的数字红包发送方法及系统。本发明实施例通过在用户移动端扫描实体二维码之后，识别目标消费实体；在满足预设的发送场景资格时，向用户移动端发送回购数字红包；进行后续的消费跟踪记录，生成消费记录数据；在具有目标消费实体的回购时，根据回购红包金额，生成打款数字红包，并在打款数字红包被领取之后，进行直接账户打款。能够识别目标消费实体，在满足预设的发送场景资格时，发送回购数字红包，进行后续的消费跟踪记录，在具有目标消费实体的回购时，根据回购红包金额，生成打款数字红包，进行直接账户打款，从而实现数字红包在线下实体购物中的有效使用与营销刺激。
一种基于物联网平台集成方法的环卫综合管理平台  一种基于物联网平台集成方法的环卫综合管理平台 
 本发明属于智慧环卫技术领域。提供了一种基于物联网平台集成方法的环卫综合管理平台，包括数据集成模块、互联网络模块、作业调度模块、通信模块。本发明的方案能够基于多源渠道实时检测到的卫生数据和预期的卫生数据来确定得出更为准确的各区域的待清扫工作量，使得确定得出的环卫车辆调度方案更为准确，有利于使得各个区域的垃圾清理效果更为良好。
一种电缆芯线包覆方法及系统  一种电缆芯线包覆方法及系统 
 本发明属于计算机辅助设计领域，提出了一种电缆芯线包覆方法及系统，该方法包括以下步骤:获取电缆芯线的三维模型；对电缆芯线的三维模型进行网格划分；识别电缆芯线有限元模型的芯线区域与包裹层区域；根据得到的芯线有限元区域和包裹层有限元区域，对芯线有限元区域和包裹层有限元区域进行有限元应力分析；获取包裹层有限元区域的应力集中区域的应距挫曲应力；对电缆芯线的三维模型的应力挫曲区域进行颜色标记，获得新的电缆芯线的三维模型。根据本发明实施例的包裹方法，可以实现检测和分析电缆芯线的包裹层在受力条件下的应力集中和应力挫曲情况，发现挫曲区域。
一种基于BIM的建筑工程施工优化管理方法及管理平台  一种基于BIM的建筑工程施工优化管理方法及管理平台 
 本申请涉及BIM建筑管理技术领域，公开了一种基于BIM的建筑工程施工优化管理方法及管理平台。所述方法包括:对建筑工程施工信息进行数据化处理，得到施工任务库并建模得到第一任务BIM模型；进行多维度分析和参数优化，得到第二任务BIM模型；进行关联映射，得到目标映射关系并创建数据交换接口；根据目标映射关系对第二任务BIM模型和当前任务计划进行时空关联和施工模拟，得到动态施工进度模拟结果和场地布置优化方案；根据动态施工进度模拟结果和场地布置优化方案对当前任务计划进行多目标优化，得到目标任务计划，并通过数据交换接口将目标任务计划更新至第二任务BIM模型，本申请提高了建筑工程施工效率和质量。
基于遍历算法和数据集优化算法的3D锚位检测方法  基于遍历算法和数据集优化算法的3D锚位检测方法 
 本发明提供一种基于遍历算法和数据集优化算法的3D锚位检测方法，利用锚泊船锚泊区域检测模型对锚地障碍物坐标集合和用蒙特卡洛随机算法生成的用以模拟待泊船锚位点坐标集合进行逐次运算，获得满足船舶安全间距数值的待泊船锚位点二维坐标集合，对其锚位圆内的点进行结合数据集优化算法的遍历运算，将遍历所得结果与待泊船船舶吃水水深值进行核对，从而获得满足二维平面和三维水深要求的待泊船锚位点。可在满足二维安全间距限制的基础上通过水深限制来实现对船舶锚位的三维检测，在满足平面安全间距的同时为驾驶人员提供满足水深限制的锚位点数据，大大提高了在锚泊实际作业中船舶锚位检测与选择的精度和安全性。
基于知识图谱的三维工艺数字化方法及系统  基于知识图谱的三维工艺数字化方法及系统 
 本发明涉及数字化技术领域，是基于知识图谱的三维工艺数字化方法及系统，具体方法包括:根据产品生产数据建立知识标准化图谱；构建PBOM原始管理模型，采集企业实际生产订单需求中的特定产品设计目标，并根据特定的产品设计目标驱动优化PBOM原始管理模型获得BOP过渡管理模型；根据制造数据驱动优化BOP过渡管理模型获得MBOM动态管理模型；实时提取MBOM动态管理模型中的实际制造数据，计算工艺数据的切换比对值；根据切换比对值执行知识标准化图谱中各个工艺模块的工艺克隆策略；本发明解决了在设计产品建模、工艺结构搭建、工序模型处理时，会消耗工艺人员大量的精力且整套系统数据管理缺少数据生态管理机制的问题。
一种网络服务器  一种网络服务器 
 本发明公开了一种网络服务器，涉及网络服务器技术领域，包括主机，其中，散热装置包括装载板、驱动电机、风扇叶、滑杆、卡板、L形杆、弯曲片和支撑板，所述装载板滑动贯穿在主机的内外壁上，所述驱动电机固定安装在装载板靠近主机的面上，所述风扇叶固定安装在驱动电机的输出端上，所述滑杆滑动贯穿在装载板的内外壁上，所述卡板固定安装在滑杆的圆周面上，所述L形杆滑动安装在装载板远离主机的面上，所述弯曲片固定安装在滑杆的圆周面上，所述支撑板固定安装在弯曲片远离滑杆的面上，通过具有弹性的弯曲片对支撑板施加推力，使装载板和主机贴合的更加紧密，从而减轻风扇叶工作时的振动影响装载板和主机的贴合。

技术分类

电信、广播电视和卫星传输服务电信、广播电视和卫星传输服务

互联网软件服务互联网软件服务

集成电路设计集成电路设计

信息集成数字服务信息集成数字服务

电气机械制造电气机械制造

计算机、通信、电子设备制造计算机、通信、电子设备制造

医药制造、生物基材料医药制造、生物基材料

石油煤矿化学用品加工石油煤矿化学用品加工

化学原料制品加工化学原料制品加工

非金属矿物加工非金属矿物加工

金属制品加工金属制品加工

专用设备制造专用设备制造

通用设备制造通用设备制造

通用零部件制造通用零部件制造

汽车制造业汽车制造业

铁路、船舶、航天设备制造铁路、船舶、航天设备制造

电力、热力生产和供应电力、热力生产和供应

燃气生产和供应燃气生产和供应

水生产和供应水生产和供应

房屋建筑、土木工程房屋建筑、土木工程

交通运输、仓储和邮政交通运输、仓储和邮政

农、林、牧、渔业农、林、牧、渔业

采矿业采矿业

农副、食品加工农副、食品加工

烟草、酒水加工烟草、酒水加工

纺织皮具居家制品纺织皮具居家制品

文教体娱加工文教体娱加工