二维表格数据多模态模型构建与训练策略

123技术园

首页 / 技术内容

二维表格数据多模态模型构建与训练策略

2025-02-11 14:43

No.1338883132748996608

技术概要

PDF全文

本技术涉及一种二维表格数据多模态模型的构建与训练策略。该模型包含表格表征模块，该模块由一系列双向注意力机制模块组成，旨在提升模型对表格数据的理解与处理能力。

背景技术

大语言模型（LLM）在表格任务中的应用越来越广泛，尤其是利用上下文学习。将表格转化为LLM可以理解的序列化信息（通常为markdown、html、格式化string、json或者SQLschema等格式），结合在整体表格任务的上下文信息中，用于各种如代码生成、表格问答、表格理解、单元格提取等常见表格任务中，是目前最常见的研究和应用模式。现有技术通过生成自监督的表格结构理解任务，评估了不同表格格式（如JSON、DFLoader、Markdown等）和八种噪声操作（如列名重命名、行列随机化等）对LLMs在基本结构理解任务（如数据查找和表格转换）中的表现。然而，由于二维表格数据字段、规模的不确定性和复杂性，在实际使用中，往往存在以下两点不足：1）不同模型、不同任务场景下，表格序列化输入形式，对任务最终性能影响极大，效果难以稳定；2）宽表（指字段数量超过100）及多表场景下，转化为序列化信息后，上下文长度过大，往往需要简化表格信息（如输入截断、行列抽取等），进一步影响了任务的精度和效果。

实现思路

阅读余下40%

技术概要为部分技术内容，查看PDF获取完整资料

该技术已申请专利，如用于商业用途，请联系技术所有人！

技术研发人员：

赵俊博陈刚查良瑜王皓波伍赛

技术所属：浙江大学计算机创新技术研究院

相关技术

基于分层过滤的顺风车站点推荐方法、装置、设备及介质 基于分层过滤的顺风车站点推荐方法、装置、设备及介质
本发明提供的基于分层过滤的顺风车站点推荐方法、装置、设备及介质，涉及共享交通技术领域。本发明根据全国站点数据与任一顺风车的初始行程路径的途径点绘制涵盖所有途径点的第一过滤区域，从而获得第一站点集合；接着在所述初始行程路径中插入第一站点集合的任一站点，构建新行程路径，遍历计算第一站点集合中所有站点的顺路系数，得到第二站点集合；然后选取第二站点集合中的任意两个站点进行组合，构建模拟新路径，通过计算顺路系数得到第三站点集合；最后判断获取的新乘客上车站点是否属于第三站点集合，若是则输出对应的下车站点。本发明能有效减少大量无效站点组合的生成，避免冗余计算与资源浪费，能更快地计算出顺风车推荐的下车站点。
一种机箱散热风扇安装结构 一种机箱散热风扇安装结构
本实用新型涉及机箱散热风扇技术领域，公开了一种机箱散热风扇安装结构，包括机箱，所述机箱的内部前后均设置有防尘网一，所述机箱的右侧设置有防尘网二，所述机箱的内部右侧下方开设有安装槽，且机箱的右侧上方开设有限位槽，所述安装槽的内部通过弹簧一安装有支撑板，所述限位槽点的内部插接有防护壳和安装框架，且防护壳和安装框架贴合在支撑板的顶部，所述防护壳的右侧内部设置有散热网一，所述机箱的右侧上方开设有插槽，便于更好的将防护壳和安装框架安装到机箱的内部，使得防护壳和安装框架从机箱内部取出较为便捷，同时通过多个风扇叶片进行联动，即可对机箱内部组件进行更好的散热。
在云系统上进行云计算的方法、装置及存储介质 在云系统上进行云计算的方法、装置及存储介质
本申请提供一种在云系统上进行云计算的方法。所述方法包括:接收第一任务和第二任务；在所述云系统的硬件资源中确定与所述第一任务关联的第一硬件资源以及与所述第二任务关联的第二硬件资源；获取所述云系统的可用硬件资源；根据所述可用硬件资源、所述第一硬件资源和所述第二硬件资源在给定时间段内确定用于执行所述第一任务的主时段以及用于执行所述第二任务的碎片时段；以及在所述主时段中执行所述第一任务以及在所述碎片时段中执行所述第二任务。
对象评价处理方法、装置以及商户评价呈现方法和装置 对象评价处理方法、装置以及商户评价呈现方法和装置
本公开实施例公开了对象评价处理方法、装置以及商户评价呈现方法和装置。对象评价处理方法不仅考虑用户对对象的评分，还考虑用户对对象的评价情况和对象对用户评价的反馈情况，从而扩展了对对象评价的维度，扩大了对象之间的评价区分度，提高了评分和评价对对象整体的影响，用户和对象对评分和评价的处理会影响总体评分和相应各维度的评价。因此，对对象的评分和评价更为准确，有利于对象改善评分和评价，也有利于用户识别对象的各维度评分和评价。
BOM生效日期抓取方法、系统、BOM订单更新方法 BOM生效日期抓取方法、系统、BOM订单更新方法
本发明涉及物料清单技术领域，公开一种BOM生效日期抓取方法、系统、BOM订单更新方法。包括如下步骤:确定目标BOM；配置BOM筛选库；遍历BOM筛选库，从中筛选出包含创建人信息的所有BOM，定义为对标BOM；根据对标BOM的条数和对标BOM的创建日期绘制广义对标椭圆；根据对标BOM的条数和对标BOM的创建日期绘制广义对标椭圆；以BOM编号相似度匹配为准则从BOM筛选库中获得对标BOM簇；确定目标BOM与对标BOM簇中每一BOM的创建人信息偏移量和创建日期信息偏移量；根据创建人信息偏移量和创建日期信息偏移量在广义对标椭圆中确定偏移点坐标，以偏移点坐标为圆心，绘制半径为r的偏差圆；基于匹配度最高的BOM的订单编号的生效日期生成目标BOM的生效日期。
基于深度学习的数字人交互视频业务实时分析方法及系统 基于深度学习的数字人交互视频业务实时分析方法及系统
本发明公开了基于深度学习的数字人交互视频业务实时分析方法及系统，涉及人机交互领域；包括:数据采集模块，其负责采集用户与数字人的交互视频数据，包括用户的语音、手势和面部表情的多模态数据；预处理模块，对采集到的视频数据进行预处理，包括去躁、增强、特征提取、针对语音数据进行语音情感分析、针对手势和面部表情数据进行关键帧提取和特征点标注；深度学习分析模块，建立深度学习模型，利用深度学习模型识别用户的多模态数据。本发明通过采集用户的语音、手势、面部表情的多模数据，进行特征处理后进行多模融合，再进行加权处理后识别意图，从而能直接识别用户意图，解决了局限性问题。
配送时长调整方法、装置及电子设备 配送时长调整方法、装置及电子设备
本申请实施例提供了一种配送时长调整方法、装置、电子设备及计算机可读存储介质，涉及计算机领域。本申请实施例实现了基于强化学习模型，并根据目标订单的订单参数信息的特征，预测目标订单的第一预估配送时长对应的目标调整信息，由于预设调整模型在预测过程中，充分利用目标订单的相关订单参数信息，结合目标订单的订单参数信息的特征，对第一预估配送时长进行调整，提升配送时长预测的准确率。
一种基于UVM的spi接口存储单元控制器的验证平台及验证方法 一种基于UVM的spi接口存储单元控制器的验证平台及验证方法
一种基于UVM的spi接口存储单元控制器的验证平台，按照单线、四线和八线模式以及搭载的不同ahb、axi总线以及command和xip访问方式，划分成不同的验证激励，可实现不同工作模式的调用和混合模式的使用；当spi接口存储单元控制器有设计更新时，也可实现更快更好的进行移植和复用。本发明采用独立封装amba axi写通道代理模块、amba axi读通道代理模块和amba ahb代理模块，使其可以广泛的应用于其他带有此种协议的模块验证平台，减少调试工作量，节省开发周期，同时也可以灵活便捷的实现当前验证平台总线接口的更换。
一种接收方离线的数字货币抗量子计算交易方法及系统 一种接收方离线的数字货币抗量子计算交易方法及系统
本发明公开了一种接收方离线的数字货币抗量子计算交易方法及系统，该方法包括以下步骤:S1、使用密钥管理服务器分别为中央银行数字货币系统、商业银行数字货币系统和用户颁发系统公私钥和公私钥；S2、实现商业银行数字货币系统与中央银行数字货币系统之间的身份认证；S3、实现用户与商业银行数字货币系统之间的身份认证；S4、实现接收方用户的离线数字货币交易。有益效果：通过在现有技术的基础上增加基于ID密码学对称密钥的保护，使得数字货币通信系统切换到抗量子计算方案的成本不高；同时，通过使用基于ID密码学的密钥颁发服务，既减轻了系统搭建、升级的复杂度，又增强了央行对商业银行的控制能力。
哈希表中的索引数据回收和分配方法及装置 哈希表中的索引数据回收和分配方法及装置
本申请提供一种哈希表中的索引数据回收和分配方法及装置，所述方法包括:在当前RAM中为目标哈希表分配RAM目标地址空间；在DDR中为目标哈希表分配DDR目标地址空间；将所述目标哈希表中待回收的各个索引数据分配至所述DDR目标地址空间中；从所述DDR目标地址空间中读取预设数量的所述索引数据并写入至所述RAM目标地址空间；基于接收到的用户输入的索引回收指令，读取该用户对应的索引参数表中的第一RAM地址指针；基于所述索引参数表中的第一RAM地址指针将预先从所述RAM目标地址空间读取的目标索引数据写入所述RAM目标地址空间；并将该第一RAM地址指针的值加1，得到第二RAM地址指针。本申请能够有效提高DPU进行数据存储的效率，减轻DPU的数据存储压力。

技术分类

电信、广播电视和卫星传输服务电信、广播电视和卫星传输服务

互联网软件服务互联网软件服务

集成电路设计集成电路设计

信息集成数字服务信息集成数字服务

电气机械制造电气机械制造

计算机、通信、电子设备制造计算机、通信、电子设备制造

医药制造、生物基材料医药制造、生物基材料

石油煤矿化学用品加工石油煤矿化学用品加工

化学原料制品加工化学原料制品加工

非金属矿物加工非金属矿物加工

金属制品加工金属制品加工

专用设备制造专用设备制造

通用设备制造通用设备制造

通用零部件制造通用零部件制造

汽车制造业汽车制造业

铁路、船舶、航天设备制造铁路、船舶、航天设备制造

电力、热力生产和供应电力、热力生产和供应

燃气生产和供应燃气生产和供应

水生产和供应水生产和供应

房屋建筑、土木工程房屋建筑、土木工程

交通运输、仓储和邮政交通运输、仓储和邮政

农、林、牧、渔业农、林、牧、渔业

采矿业采矿业

农副、食品加工农副、食品加工

烟草、酒水加工烟草、酒水加工

纺织皮具居家制品纺织皮具居家制品

文教体娱加工文教体娱加工