一种基于异构硬件的AI数据处理加速方法

123技术园

首页 / 技术内容

一种基于异构硬件的AI数据处理加速方法

2025-02-22 12:25

No.1342834685126123520

技术概要

PDF全文

本技术公开了一种基于异构硬件的AI数据处理加速方法，属于数据处理计算技术领域，具体包括:配置API接口，为硬件设置算子信息库，设置MAP操作的算子信息，加载算子信息库和CPU数据处理流水线，提取流水线中的MAP操作建立IR树，遍历IR树，利用算子信息库可策略搜索方法筛选出可迁移节点，对可迁移节点序列化，建立可迁移节点操作序列并转存入树适配器中，根据负载均衡策略和反序列化，将可迁移节点迁移到不同的异构加速硬件中执行，同时利用树适配器删除IR树中的可迁移节点，将更新后的IR树标记为执行树，CPU按照执行树并行执行MAP操作，本发明能够自动有效整合和利用异构硬件资源进行数据处理加速。

背景技术

AI数据处理流程包括数据收集、存储、预处理、模型训练和推理优化等步骤，现有的AI数据处理加速方案多应用于模型训练阶段，采用调参、改良算法等方法提高数据处理效率。在实际数据处理过程中，数据预处理过程需要的工作量可能常常占到总工作量的一半以上，为了提高数据处理速度，目前有图像处理单元GPU、神经处理单元NPU等异构硬件来加速AI运算。在现有技术中，数据处理部分通常是使用CPU对数据集进行数据加载和预处理，然后将处理后的数据分批输入GPU、NPU或TPU等加速硬件中进行网络计算。但是随着多模态领域数据规模的增长，现有技术在面对大量数据时，CPU处理速度会存在瓶颈，并且现有的一些技术，例如TensorFlow提供的tf.data.Dataset模块仅在CPU上进行数据预处理，缺乏对异构硬件的固有支持，同时现有技术在多种数据操作和异构硬件之间的协同方面也存在局限性，例如JAX库能够在GPU和TPU上实现加速计算，但是仅支持静态形状的张量操作，并且仅支持特定图像处理操作。因此本发明提出一种基于异构硬件的AI数据处理加速方法，用以解决现有技术存在的问题。

实现思路

阅读余下40%

技术概要为部分技术内容，查看PDF获取完整资料

该技术已申请专利，如用于商业用途，请联系技术所有人！

技术研发人员：

顾乃杰王聪张辉曹延飞

技术所属：中国科学技术大学

相关技术

一种用于船舶装置虚拟训练的建模系统  一种用于船舶装置虚拟训练的建模系统 
 本发明属于虚拟现实训练技术领域，尤其涉及一种用于船舶装置虚拟训练的建模系统。包括人机交互层、数据通信层、可视化建模层；人机交互层包括信号采集模块、指令生成模块、指令融合模块、信号发送模块；数据通信层包括信号发射终端、数据接收终端；可视化建模层包括数据读取组件、参数化建模组件、位置特征编辑组件、结构特征编辑组件、流程编辑处理组件；本申请的用于船舶装置虚拟训练的建模系统主要基于当前船舶装置虚拟训练系统的已有软硬件设备，提供一种优化和概念股装置建模方案，并以此为基础提供基于虚拟现实交互的装置高效建模方案，用于满足多样化训练内容，为提高训练质量，降低重复的大量建模作业提供解决途径。
基于高风险区域划分的病原微生物物联网实时监测系统 基于高风险区域划分的病原微生物物联网实时监测系统
本发明公开了一种基于高风险区域划分的病原微生物物联网实时监测系统，涉及病原微生物监测技术领域。包括荧光检测模块，对样本进行PCR扩增，并检测每一PCR扩增循环的荧光均值；数据传输模块，将检测到的荧光均值传输至数据处理模块；数据处理模块，基于移动窗口计算，动态计算每一移动窗口内荧光均值的扩增指数；第一判断模块，当扩增指数满足预先设定的阈值时，则判断该样本的检测结果为阳性；预警模块，当检测出样本为阳性时，发出警报并将检测结果上传至疾控中心。本发明采用将病原微生物的检测与物联网相结合，既免去了人工记录数据的繁琐性，又保证了数据的及时性，可以在最快时间内实现预警和防控措施。
一种交互式一体机的主壳体 一种交互式一体机的主壳体
本实用新型公开了一种交互式一体机的主壳体，涉及一体机领域，包括外壳体和触控屏，外壳体包括壳体主体、条状散热孔和主动散热背板，壳体主体背部开设有贯穿的条状散热孔，条状散热孔设有若干组且均匀设置在壳体主体背部两侧，壳体主体背部开设有开口，开口内固定有主动散热背板，该一种交互式一体机的主壳体，外壳体前端开设有凹槽，凹槽内固定有触控屏，该一体机内置有专门的散热结构，主动的散热结构能够很好的将内部运行的热量进行排出，且该一体机在使用时可根据实际的安装需要来选择是否需要将机体进行固定放置，机体背部设有支撑架，可将一体机进行斜向的放置，更加便于使用者操作触控屏。
无缝拼接的大幅面数码打印方法及系统 无缝拼接的大幅面数码打印方法及系统
本发明公开了无缝拼接的大幅面数码打印方法及系统，属于数码打印技术领域。为解决打印效率低下以及拼接精度不高的问题，通过图像预处理模块对原始图像进行精确分析，能够确保每个子图像在打印前都具备最佳的打印质量，图像分割单元能够准确地根据打印设备的打印幅面将原始图像分割成合适的子图像，不仅确保了打印的可行性，还提高了打印效率，每个子图像都附带有详细的拼接信息，生成的拼接信息能够确保在打印过程中子图像能够准确地拼接在一起，从而实现大幅面图像的完整、准确打印，在任务分配打印阶段，系统能够根据外设组件的性能和负载情况调整打印任务的均衡分配，有助于提高打印效率，避免资源浪费，并确保打印任务能够按时完成。
一种数据处理方法、装置、服务器及存储介质 一种数据处理方法、装置、服务器及存储介质
本公开实施例公开了一种数据处理方法、装置、服务器及存储介质，该方法包括:接收各个第一用户通过目标客户端对每个第一用户的关联图像的第一缺陷检测结果，并将各个关联图像的第一缺陷检测结果更新至第一中间件的数据缓存空间；其中，第一中间件的数据缓存空间用于缓存设定类型数据以及缓存查询结果；响应于第二用户的查询请求，基于更新后的第一中间件的数据缓存空间确定查询结果。将数据转存到缓存空间，在缓存空间中进行查询，与直接在数据库中查询相比，查询效率更高，实时性强；缓存空间中，加入了第一缺陷检测结果，提高了数据查询的准确率。
基于物联网灯具系统生成部署位置地图的方法和装置 基于物联网灯具系统生成部署位置地图的方法和装置
本发明公开了基于物联网灯具系统生成部署位置地图的方法和装置。该方法先收集被触发的每一局部路线灯具组的初始数据；再利用每一局部路线灯具组的初始数据进行灯具坐标计算处理，得到每一局部路线灯具组中各个灯具的初始坐标，并生成对应每一局部路线灯具组的初始坐标图；再对每一初始坐标图中各灯具的初始坐标进行位置优化处理并生成优化坐标图；再根据各灯具之间的无线通信信息换算出各灯具间的相对位置关系，并利用相对位置关系对每一优化坐标图进行灯具坐标进行变换处理，得到所有灯具的实际坐标，并生成灯具部署位置地图。本发明利用灯具的感应和通信能力自动生成实际空间中灯具分布的灯具部署位置地图，无需人工测量，降低了部署成本。
一种服务的运营业务的实施效果评估方法及装置 一种服务的运营业务的实施效果评估方法及装置
本申请公开了一种服务的运营业务的实施效果评估方法及装置，本申请实施例在对服务的运营业务的实施效果进行评估时，采用了该运营业务在服务中的用户端感知深度，作为评估指标进行评估。该运营业务在服务中的用户端感知深度是由该服务在设定单位时间段的申赔率指标确定的。由于基于用户端对该运营业务在服务总的感知深度可以确定准确的该运营业务在服务中的实施效果，所以提高了评估运营业务在服务中的实施效果的评估准确率。
射频中和器的功率调整方法及功率控制系统 射频中和器的功率调整方法及功率控制系统
本申请涉及一种射频中和器的功率控制方法和射频中和器的功率控制系统，包括:实时检测射频中和器的发射极电流和发射极电压；判断发射极电流是否处于设定电流值的范围内，若是，判断发射极电压是否大于电压阈值；若发射极电压不大于电压阈值，将射频中和器的射频功率减小第一调整量；在经过第一等待时间之后，判断射频功率是否处于稳定状态，当射频功率达到稳定状态之后，继续判断发射极电流是否处于设定电流值的范围内的步骤；若发射极电流低于设定电流值的范围，停止减少射频功率调整；该技术方案，确保了射频中和器的稳定性，延长射频中和器的使用寿命，发射极电流始终保持稳定，增加射频中和器使用寿命，维护更方便更智能。
ECharts图表自定义提示组件的方法及装置 ECharts图表自定义提示组件的方法及装置
本发明实施例中提供了一种ECharts图表自定义提示组件的方法、装置及电子设备，属于数据处理技术领域，该方法包括:通过props接收外部传入的参数集合P，在参数集合P中提取配置参数；使用ECharts库中的init方法根据chartID来创建一个新的ECharts实例，并构建一个完整的ECharts配置对象；对于提示框样式T，采用自定义CSS类进行灵活定制；对于ECharts图表中包含的数据项di，通过格式化函数fmt将数据项di格式化为字符串；通过函数fet设置提示框的enterable属性为true，如果数据项集合D不为空，则应用性能优化措施并渲染提示框内容，否则，不做任何操作。本发明提高了ECharts图表的可定制性和交互体验。
基于时空标签时空关联的基础数据检索与集成展示方法 基于时空标签时空关联的基础数据检索与集成展示方法
本发明公开了一种基于时空标签时空关联的基础数据检索与集成展示方法，包括对基础数据进行时空标签化；建立标签之间关联关系；基于时空标签，一键式检索基础数据等步骤；本发明的优点在于:通过本发明使智慧城市管理中的人、地、物、组织、事件进行标签化分类及构建数据间的逻辑关系，利用地图可视化展示相关元素间的空间关系和移动轨迹关系，有效的支持智慧城市针对目标进行全生命周期的管理。

技术分类

电信、广播电视和卫星传输服务电信、广播电视和卫星传输服务

互联网软件服务互联网软件服务

集成电路设计集成电路设计

信息集成数字服务信息集成数字服务

电气机械制造电气机械制造

计算机、通信、电子设备制造计算机、通信、电子设备制造

医药制造、生物基材料医药制造、生物基材料

石油煤矿化学用品加工石油煤矿化学用品加工

化学原料制品加工化学原料制品加工

非金属矿物加工非金属矿物加工

金属制品加工金属制品加工

专用设备制造专用设备制造

通用设备制造通用设备制造

通用零部件制造通用零部件制造

汽车制造业汽车制造业

铁路、船舶、航天设备制造铁路、船舶、航天设备制造

电力、热力生产和供应电力、热力生产和供应

燃气生产和供应燃气生产和供应

水生产和供应水生产和供应

房屋建筑、土木工程房屋建筑、土木工程

交通运输、仓储和邮政交通运输、仓储和邮政

农、林、牧、渔业农、林、牧、渔业

采矿业采矿业

农副、食品加工农副、食品加工

烟草、酒水加工烟草、酒水加工

纺织皮具居家制品纺织皮具居家制品

文教体娱加工文教体娱加工