GPU动态内存管理技术、系统、设备及存储介质

123技术园

首页 / 技术内容

2025-02-06 18:12

No.1337123785341673472

技术概要

PDF全文

本技术涉及计算机架构领域，提出了一种GPU动态内存管理技术，包括：获取GPU处理的目标稀疏矩阵；对该稀疏矩阵执行动态优化，生成多个优化子块矩阵。

背景技术

稀疏矩阵向量乘(SpMV)和稀疏矩阵乘法(SpMM)是在计算科学和工程领域中广泛使用的重要数学运算。在这两种运算中，矩阵被表示为稀疏矩阵，即大部分元素为零。这种稀疏矩阵的特点使得在处理大规模数据时能够有效地节省内存和计算资源。而由于SpMV和SpMM操作的不规则性以及相关存储器存储带宽的有限性，导致在GPU上实现更快并行的SpMV以及SpMM操作具有很大的挑战性，现有技术目前主要通过分块处理稀疏矩阵进行SpMV和SpMM的加速计算。虽然分块处理稀疏矩阵具备提高密集向量的数据局限性、更容易实现负载均衡以及更加简便和灵活等优势，但是也存在如下问题：首先，将稀疏矩阵划分为多个较小的分块可以更细腻地分配任务，容易实现负载均衡，但会增加通信开销。其次，SpMV和SpMM等函数的子块内部的稀疏格式的数据结构通常包括多个数组，现有技术均是将多个数组分别进行Malloc，而由于子块通常很小以及子块通常是稀疏矩阵，所以，每个数组所需要的内存大小实际上很小，都会远小于所申请的内存单元；这导致生成的多个GPU内存单元内部存在巨大的内存碎片，极大的浪费了GPU宝贵的内存资源，同时还很大程度上降低了子块内数据的数据局部性。最后，在不同品牌的GPU上所造成的空间浪费也不同，比如，在Nvidia GPU上，每次申请分配内存，都是以512B为基本内存单位去进行分配的，在国产DCU上，每次申请分配内存，都是以4KB为基本内存单位去进行分配的，在分块机制下，每个分块内数据结构所对应的数组大小远小于上述提到的基本内存单位；这导致在GPU上对矩阵数据应用分块方法时，会造成在不同品牌的GPU上显示出较大性能差异的现象。

实现思路

阅读余下40%

技术概要为部分技术内容，查看PDF获取完整资料

该技术已申请专利，如用于商业用途，请联系技术所有人！

技术研发人员：

解晨浩丛兴刘轶钱德沛杨海龙

技术所属：北京航空航天大学

相关技术

基于上下文感知和跨模态共享注意力的对话情感识别方法  基于上下文感知和跨模态共享注意力的对话情感识别方法 
 一种基于上下文感知和跨模态共享注意力的对话情感识别方法，采集不同对话场景下的蕴含上下文的文本以及音频信息形成数据集，完成数据集的构建；对构建的数据集进行预处理，以提取相应的模态特征；分别搭建一个音频上下文感知网络、一个跨模态共享注意力网络及一个自适应融合网络，再将所搭建的网络依次连接形成初始情感识别模型；对初始情感识别模型进行端到端的训练，对训练好的情感分类模型进行保存，形成情感识别模型；采用特征编码器对所采集到的文本及音频数据进行特征提取，得到文本及音频特征；将文本及音频特征输入至情感识别模型中，利用情感识别模型识别并输出预定义的情况类别。该方法能有效解决空间异质性问题，具备优异的识别效果。
一种散热计算机机箱 一种散热计算机机箱
本实用新型公开了一种散热计算机机箱，包括:主体单元，所述主体单元包括机箱箱体，所述机箱箱体的侧壁上开设有多个通孔；散热组件，所述散热组件包括固定箱和固定框，所述固定箱固定连接在机箱箱体的上端，所述固定框固定连接在机箱箱体的内壁上，所述固定箱的一侧固定连接有电动转盘，所述电动转盘的输出端固定连接有横杆，其有益效果为：通过电动转盘、横杆、一号锥齿轮和二号锥齿轮会带动连接杆转动，通过连接杆、大齿轮和小齿轮会带动转动杆转动，通过转动杆会带动单向叶片转动，通过单向叶片转动会带动空气流动，并使得热空气从散热孔排出，提高散热效果，避免温度过高对其内部电子器件的性能和寿命产生影响。
板卡结构及具有其的服务器 板卡结构及具有其的服务器
本申请实施例提供了一种板卡结构及具有其的服务器，板卡结构包括板卡本体和板卡支架，板卡本体上设置有多个第一锁紧孔；板卡支架上设置有在多个第二锁紧孔，多个第二锁紧孔与多个第一锁紧孔一一对应地相对设置，以通过在各个第一锁紧孔和对应的第二锁紧孔内穿设锁紧部件，以将板卡本体与板卡支架锁紧，至少解决了相关技术中板卡与机箱通过卡扣固定容易脱落的问题。
一种基于申威威鑫3231处理器的计算机系统核心处理模块 一种基于申威威鑫3231处理器的计算机系统核心处理模块
本实用新型涉及计算机系统处理器技术领域，尤其涉及一种基于申威威鑫3231处理器的计算机系统核心处理模块，一种基于申威威鑫3231处理器的计算机系统核心处理模块，包括申威3231处理器，所述申威3231处理器与COME连接器之间为电性连接，所述COME连接器与电源模块之间为电性连接，所述电源模块与微控制器之间为电性连接，所述电源模块与电源适配器之间为电性连接。本实用新型通过将申威威鑫3231处理器进行最小化设计，将服务器级处理器进行系统化设计、精简设计，形成最小系统计算机模块，从而解决国产桌面级计算机系统性能偏弱，不满足大数据处理要求的使用场合。
一种带有射频标签手术器械自动识别装置 一种带有射频标签手术器械自动识别装置
本实用新型涉及一种带有射频标签手术器械自动识别装置，属于手术器械扫码技术领域；控制开关通过电源线与线性模组连接传输电力，线性模组上的滑座顶部用来放置需要扫描的带射频标签的手术器械，扫码器直接扫描二维码读取商品信息传输进电脑机箱中软件内，而放大镜则将射频标签放大一定的倍数后由射频标签扫描器进行扫描识别并传输进电脑机箱中软件内，操作柜的侧面上端固定设有挂钩，挂钩上悬挂手持扫码枪，手持扫码枪与扫码器有相同功能，方便人远距离操作，只需1名作业人员即可实现两道工序，降低产品生产成本，提高产品生产效率；操作柜的底部设有四组脚杯脚轮，操作柜的正面通过轴销设有双开门，用来放置电脑机箱或日常维修工具。
一种具有防撞功能的计算机机箱 一种具有防撞功能的计算机机箱
本实用新型涉及计算机机箱技术领域，公开了一种具有防撞功能的计算机机箱，包括机箱，机箱的两侧面均设有防护组件，防护组件包括防撞板和防护板，防护板通过快拆组件与机箱相连接，防撞板通过拼接组件与防护板相连接；防撞板内设有朝向防护板方向开口的第一空腔，防护板内设有朝向防撞板方向开口的第二空腔，第一空腔和第二空腔共同组成填充腔,填充腔内能够填放减震材料。通过防护组件的设置，使得其能够对机箱进行防护，由于防撞板和防护板的成本低廉，使得防撞板和防护板损坏时能够随意更换，从而降低了对计算机机箱进行防护的成本，且易于推广。
计算机及飞行器 计算机及飞行器
本申请实施例涉及电子设备技术领域，公开了一种计算机及飞行器，该计算机应用于飞行器，飞行器的机身上开设有安装口；计算机包括机箱、电路板和散热器，电路板和散热器均设置于机箱内；机箱的一面为散热面，散热面的外壁中间设置有散热翅片，散热器抵接于电路板和散热面的内壁之间，用于将电路板的热量传导至散热面的散热翅片上；散热面的外壁边缘设置有安装部，安装部用于与机身上位于安装口边缘的位置固定连接，以使散热翅片从安装口伸出至机身之外。通过上述方式，本申请实施例能够保证计算机满足机载工作环境要求的同时，提升其散热性能。
一种基于用户画像的商品推荐方法及系统 一种基于用户画像的商品推荐方法及系统
本申请涉及商品推荐技术领域，尤其是涉及一种基于用户画像的商品推荐方法及系统。该方法包括:获取用户的浏览信息，分析浏览信息，提取用户特征信息；分析用户特征信息，确定用户画像信息；根据用户画像信息，确定推送内容信息；输出推送内容信息，以供用户浏览和使用。本申请通过分析用户的浏览信息，提取用户特征信息，在用户特征信息的基础上，确定用户画像信息，并根据用户画像信息，确定推送内容信息，以输出与用户画像高度符合的推送内容信息，供用户浏览和使用，提高对用户画像的精准程度，使推送内容信息与用户实际需求契合，改善用户使用体验，满足用户个性化需求，进而提高用户粘性。
一种适用于大数据处理的计算机设备 一种适用于大数据处理的计算机设备
本发明涉及大数据处理技术领域，且公开了一种适用于大数据处理的计算机设备，包括驱动机构，所述驱动机构还包括有安装板，本发明利用扇叶旋转时，扇叶自身将产生较大风压的特点，设备内部设置有斜面板以及刮刀，在使用该设备前，将该设备安装在计算机机箱的入风口位置，并接通动力马达的电源，随着动力马达产生旋转的力，动力马达通过固定块带动滑动架以及扇叶产生旋转，完成送风冷却的工序，此时，扇叶自身承受较强风压，并在扇叶外壁形成较快的气流，而该气流将推动刮刀以及斜面板沿着扇叶的外壁向固定块方向移动，这个过程中刮刀将对扇叶的外壁进行单次剐蹭，去除粘黏在扇叶表面的大部分毛絮或灰尘，实现设备在使用前的自主清洁。
光纤电流传感器的非线性误差建模方法、介质及电子设备 光纤电流传感器的非线性误差建模方法、介质及电子设备
本发明公开一种光纤电流传感器的非线性误差建模方法、介质及电子设备，针对光纤电流传感器中对于传播的光信号会产生影响的传感光纤环、相位调制器、45°光纤熔点、光纤起偏器进行建模得到光束传播过程中影响光信号的各部件的计算模型，光源发出的光束依次经过上述计算模型后到达光电探测器，得到被光电探测器检测到的干涉光强的交流分量的计算模型。本方案，确定光束传播过程中在各部件中的光信号，确定进入到传感光纤环内的光信号在被检测电流影响下的干涉结果，在光电探测器检测到干涉光强后进行交流分量的计算与实际干涉光强的交流分量的结果相差较小。本申请得到的传感光纤环的误差建模结果更准确，能确保光纤电流传感器的检测结果更准确。

技术分类

电信、广播电视和卫星传输服务电信、广播电视和卫星传输服务

互联网软件服务互联网软件服务

集成电路设计集成电路设计

信息集成数字服务信息集成数字服务

电气机械制造电气机械制造

计算机、通信、电子设备制造计算机、通信、电子设备制造

医药制造、生物基材料医药制造、生物基材料

石油煤矿化学用品加工石油煤矿化学用品加工

化学原料制品加工化学原料制品加工

非金属矿物加工非金属矿物加工

金属制品加工金属制品加工

专用设备制造专用设备制造

通用设备制造通用设备制造

通用零部件制造通用零部件制造

汽车制造业汽车制造业

铁路、船舶、航天设备制造铁路、船舶、航天设备制造

电力、热力生产和供应电力、热力生产和供应

燃气生产和供应燃气生产和供应

水生产和供应水生产和供应

房屋建筑、土木工程房屋建筑、土木工程

交通运输、仓储和邮政交通运输、仓储和邮政

农、林、牧、渔业农、林、牧、渔业

采矿业采矿业

农副、食品加工农副、食品加工

烟草、酒水加工烟草、酒水加工

纺织皮具居家制品纺织皮具居家制品

文教体娱加工文教体娱加工