循环缓存优化的滑动窗口注意力机制加速技术

123技术园

首页 / 技术内容

2025-02-11 21:19

No.1338982884396244992

技术概要

PDF全文

本技术介绍了一种循环缓存优化的滑动窗口注意力机制加速方法及其装置，旨在提高滑动窗口注意力机制中的内存存储效率，解决大模型在序列处理上速度慢的问题。

背景技术

随着人工智能技术的发展，特别是深度学习技术的进步，注意力机制（AttentionMechanism），因其在处理长依赖关系上的优越性能而逐渐成为自然语言处理、语音识别等技术领域的核心组件。传统的神经网络模型在处理长序列时存在梯度消失或梯度爆炸的问题，同时，随着序列长度的增长，模型计算的复杂度与序列长度的平方成线性关系，这使得大模型在长序列数据上的处理变得非常耗时。近年来，Transformer架构通过引入滑动窗口自注意力机制(Sliding WindowAttention，SWA)，允许模型并行处理固定窗口大小的数据，从而显著提高了训练效率。 SWA的计算过程如下：其中，为二维矩阵，N1为文本长度，H为隐藏层长度；dk 为矩阵第二维度的长度H，KT 为矩阵K的转置。在进行softmax处理之前乘以一个掩码（），SA的Mask为下三角的矩阵，使得每个文本位置的token只注意到该位置及之前的文本内容。SWA的Mask与SA不同，存在一个窗口大小(window size)，使得Attention只关注窗口大小内的文本内容。在大模型(Large Language Model，LLM)推理过程了为了减少模型的重复计算，一般会使用KV Cache技术对Attention中计算的K、V矩阵进行缓存，避免了新请求Query推理计算时重复历史KV矩阵的计算，降低模型推理的计算量，提高模型的推理速度。然而现有的一些KV Cache技术对于SWA计算存在内存的利用率较低、存储效率低下的问题。

实现思路

阅读余下40%

技术概要只是部分技术介绍，您可查阅PDF获取完整资料

该技术已申请专利，如用于商业用途，请联系技术所有人！

技术研发人员：

岳丹阳

技术所属：上海岩芯数智人工智能科技有限公司

相关技术

一种不涉及隐私的云平台管理系统 一种不涉及隐私的云平台管理系统
本发明涉及一种不涉及隐私的云平台管理系统，其特征在于，至少包括与至少一个TOF图像传感器(301)连接的信息接收模块(300)，所述TOF图像传感器采集的不处于限定温度范围内的场景以真实色彩显示，从而所述TOF图像传感器采集的完整图像包括以真实色彩显示的场景图像和非真实色彩显示的三维轮廓图像，所述非真实色彩的填充式轮廓图像的填充区域以表示个体体温的颜色填充，从而形成具有体温特征的三维轮廓图像，在若干社区的管理终端与云平台系统连接的情况下，所述管理终端通过若干设置有TOF图像传感器的终端采集的动态的三维轮廓图像的流动确定人口的动态分布以及人员流动异常情况。本发明通过非真实的三维轮廓图像保护隐私不显示。
一种适用于日志虚拟列表场景的搜索滚动定位方法及系统 一种适用于日志虚拟列表场景的搜索滚动定位方法及系统
本发明属于信息处理技术领域，具体公开了一种适用于日志虚拟列表场景的搜索滚动定位方法及系统，包括:日志初次渲染；当用户进行搜索操作时，系统根据搜索字符进行日志检索、匹配，并将日志搜索结果分组下发到对应分组区块组件和行组件，调整当前展示组为行组件信息所对应的组，进行渲染；获取焦点日志位置信息并滚动到对应位置。本发明通过将虚拟列表日志进行分组，并设计与之对应的搜索标记对象数组结构，通过在计算层获取搜索命中对象所在的分组、行、和字符位置并记录。在渲染时，直接通过分组信息渲染对应的分区，以解决传统虚拟列表无法获取可视区域外元素位置的问题，实现了快速搜索滚动定位，并支持正序倒序滚动。
用于处理算子的方法和装置 用于处理算子的方法和装置
本公开的实施例公开了一种用于处理算子的方法、用于处理算子的装置、电子设备与计算机可读存储介质。该方法包括:基于神经网络模型，确定所述神经网络模型对应的计算图；基于所述计算图，确定能够使得所述神经网络模型运行的搜索空间，所述搜索空间包括所述多个算子的内存布局的候选集和所述多个算子的实现方式的候选集；基于所述搜索空间，确定融合有所述多个算子的内存布局信息和实现方式信息的中间表示；以及基于所述中间表示在硬件上的测试结果，调整所述多个算子的内存布局和实现方式。根据本公开的实施例能够提升所部署的神经网络模型的性能。
一种非均匀时间步长的热电路仿真方法及相关设备 一种非均匀时间步长的热电路仿真方法及相关设备
本发明提出了一种非均匀时间步长的仿真方法及相关设备，可快速实现观测点的温度T(t)的卷积计算，极大提升了仿真速率。本发明提出的一种非均匀时间步长的热电路仿真方法，包括:步骤S1，导入仿真模型，设置热仿真参数，执行热电路提取，得到热电路响应函数H(s)。其中，所述设置热仿真参数包括设置观测点。步骤S2，设置热源功率曲线P(t)，所述热源功率曲线P(t)为定义热源随时间变化的功率曲线，所述热源功率曲线P(t)根据热源的使用场景设置。步骤S3，设置非均匀步长的输出时间序列。步骤S4，根据所述热电路响应函数H(s)、热源功率曲线P(t)以及非均匀步长的输出时间序列，执行热瞬态仿真。步骤S5，基于热瞬态仿真结果，查看观测点温度响应曲线。
基于数字化身份证的物品认证方法、系统及存储介质 基于数字化身份证的物品认证方法、系统及存储介质
本发明公开了基于数字化身份证的物品认证方法、系统及存储介质，属于数据识别认证技术领域，包括:基于数据信息生成物品的数字化身份证，基于加密模式生成数字化身份证对应的第一编码；基于存储节点生成区块链网络，将第一编码分割后依次存储至区块链网络中，并生成第一编码对应的验证数据和组合数据；在区块链网络中获取搜索节点，生成与待验证数据对应的检索编码，基于加密模式和搜索节点生成解密密钥，基于解密密钥解密检索编码，生成待分析数据；构建认证模式，基于认证模式、验证数据、组合数据和待分析数据判定待验证数据是否被修改，并基于判定结果完成待验证物品的认证。通过本发明可以提高物品认证的安全性和准确性。
一种智能设计过程的流入量图生成方法、设备及存储介质 一种智能设计过程的流入量图生成方法、设备及存储介质
本发明公开了一种智能设计过程的流入量图生成方法、设备及存储介质，属于工业制造技术领域，该方法包括:获取零件的坯料线数据，所述坯料线数据包括第一闭合线和第二闭合线，所述第一闭合线为所述零件的闭合后坯料线，所述第二闭合线为所述零件的拉延到底坯料线；根据所述第一闭合线和所述第二闭合线生成流入量线，根据所述流入量线生成所述流入量线的标注信息；根据所述第一闭合线、所述第二闭合线、所述流入量线和所述标注信息生成所述零件的流入量图。本发明旨在减少零件工艺设计流程的工序，节省时间资源和人力资源，提高零件的设计生产效率。
基于动态数据库直方图发布的差分隐私方法、系统及设备 基于动态数据库直方图发布的差分隐私方法、系统及设备
本发明公开了一种基于动态数据库直方图发布的差分隐私方法、系统及设备，属于数据库隐私保护技术领域，方法包括在收到任意时间范围基于直方图的数据查询请求后，根据时间节点构建树型结构；统计并汇总树型结构所有时间节点的直方图；对每个时间节点的直方图添加满足差分隐私的噪声，得到加噪直方图并发布；选择并汇总目标时间节点上的加噪直方图对数据查询请求进行响应。本发明基于树型结构对时间进行划分，降低噪声的扰动，从而提高了直方图发布的精度。根据时间节点构建树型结构，可以适用于任意时间范围内基于直方图的数据查询。采用树形结构对所有节点直方图进行汇总扰动可以及时响应数据分析者的任意查询，提高了查询反馈的实时性。
一种煤层开采沉陷的模拟方法及系统  一种煤层开采沉陷的模拟方法及系统 
 本发明公开了一种煤层开采沉陷的模拟方法及系统，涉及煤矿开采沉陷领域，包括:煤层进行开采工作导致开采工作面以上的地表发生沉陷，获取地表沉陷所形成的地表下沉曲线；将地表下沉曲线分段，获得地表下沉曲线中部的盆地曲线，以及地表下沉曲线中部以上的沉降曲线；使用函数模型分别对沉降曲线和盆地曲线进行拟合，以构建开采沉陷预测模型，该模型反映开采工作面走向上由地表沉陷引起的垂直沉降情况。本发明能够准确预测开采沉陷情况。
一种基于进化算法的冷藏车辆配送路径优化方法  一种基于进化算法的冷藏车辆配送路径优化方法 
 本发明公开了一种基于进化算法的冷藏车辆配送路径优化方法，包括:1、分析易腐货物对不同运输温度的需求和异构冷藏车不同运输温度区间的适配关系，建立异构冷藏车辆配送问题模型；2进行两阶段优化，第一阶段基于进化算法生成每辆冷藏车的潜在路径，第二阶段通过路径聚类与融合机制生成综合路径方案；3基于进化算法迭代搜索潜在单条路径并定期对种群执行局部搜索操作生成潜在路径集合，使用聚类方法对路径集合进行聚类，多轮次选取不同聚类簇中的的路径进行聚合，并处理未访问的客户，形成完整路径方案，最终输出到最优易腐货物冷藏配送方案。本发明能解决异构冷藏车辆配送路径优化问题，在减少易腐货物配送成本的同时最大限度降低货物损失。
冰川跃动预测与数据样本增强管理方法  冰川跃动预测与数据样本增强管理方法 
 本发明公开了冰川跃动预测与数据样本增强管理方法，具体涉及冰川遥感监测领域，用于解决表碛覆盖型冰川局部反照率异常效应的精准识别与处理问题，是通过综合分析光谱与温度的耦合关系以及温度梯度的空间敏感性，实现对表碛覆盖型冰川局部反照率异常效应的精准识别与处理。能够有效区分反照率异常的主要成因，并通过科学选择光学与热红外遥感融合模式或光学与雷达遥感融合模式，针对性地修正异常区域，从而显著提高冰川识别的精度与跃动预测的准确性。通过多层次的遥感数据校正和特征提取，为后续分析奠定了高精度的数据基础；在生成增强样本并优化预测模型的过程中，进一步提升了冰川跃动预测的可靠性与响应速度。

技术分类

电信、广播电视和卫星传输服务电信、广播电视和卫星传输服务

互联网软件服务互联网软件服务

集成电路设计集成电路设计

信息集成数字服务信息集成数字服务

电气机械制造电气机械制造

计算机、通信、电子设备制造计算机、通信、电子设备制造

医药制造、生物基材料医药制造、生物基材料

石油煤矿化学用品加工石油煤矿化学用品加工

化学原料制品加工化学原料制品加工

非金属矿物加工非金属矿物加工

金属制品加工金属制品加工

专用设备制造专用设备制造

通用设备制造通用设备制造

通用零部件制造通用零部件制造

汽车制造业汽车制造业

铁路、船舶、航天设备制造铁路、船舶、航天设备制造

电力、热力生产和供应电力、热力生产和供应

燃气生产和供应燃气生产和供应

水生产和供应水生产和供应

房屋建筑、土木工程房屋建筑、土木工程

交通运输、仓储和邮政交通运输、仓储和邮政

农、林、牧、渔业农、林、牧、渔业

采矿业采矿业

农副、食品加工农副、食品加工

烟草、酒水加工烟草、酒水加工

纺织皮具居家制品纺织皮具居家制品

文教体娱加工文教体娱加工