基于粒球计算的文本噪声标签优化技术

123技术园

首页 / 技术内容

基于粒球计算的文本噪声标签优化技术

2025-02-10 08:05

No.1338420603715330048

技术概要

PDF全文

本技术方案专注于自然语言处理，旨在通过粒球计算对文本噪声标签进行修正。该技术通过使用人工标注的清洁文本数据集对Bert模型进行训练，以获得一个经过优化的Bert模型，进而提高文本噪声标签的修正效率和准确性。

背景技术

随着计算能力的不断提高，大规模数据集的出现使深度神经网络在各个领域取得了巨大成功。众所周知，深度神经网络的性能在很大程度上依赖于庞大的高质量标注数据集。然而，由于人工标注的疏忽或自动标注的不准确，标注过程不可避免地会引入误差。标签噪声会严重影响深度神经网络的性能，因为模型会学习到不正确的关联和模式。噪声样本如果达到一定比例,最终对模型的影响是毁灭性的。标签修正是一种自然语言处理技术，是一种将数据集中样本错误的标签修正为正确的标签的方法。噪声标签修正作为数据噪声处理的一项子任务其重要性不言而喻。基于粒球计算的标签修正应约而生。目前处理噪声标签的主流方法大致可分为两大类：数据级方法和模型级方法。(1)数据级方法主要涉及数据清理和预处理。这些方法旨在通过使用人工审核、自动检测或样本选择和重新加权等技术来清理和纠正噪声标签，从而减轻噪声标签对模型训练的影响。然而，这些方法通常依赖于大量的人工干预，既耗时又容易产生主观性。(2)模型级方法侧重于在训练过程中增强模型的鲁棒性。这些方法包括设计稳健的损失函数、执行噪声建模或采用集合学习和半监督学习技术来减轻噪声标签的负面影响。然而，这些方法通常涉及复杂的算法设计和大量的计算资源，在实际应用中可能难以实现，或需要对模型进行重大调整。

实现思路

阅读余下40%

技术概要为部分技术内容，查看PDF获取完整资料

该技术已申请专利，如用于商业用途，请联系技术所有人！

技术研发人员：

赵健棚王泽丽夏书银

技术所属：重庆邮电大学

相关技术

一种应用于企业精益管理系统的大数据分析方法  一种应用于企业精益管理系统的大数据分析方法 
 本发明公开了一种应用于企业精益管理系统的大数据分析方法，所述分析方法如下:步骤一：构建大数据分析模型；并提取企业精益管理系统数据；步骤二：对提取的企业精益管理系统数据进行解析；步骤三：解析后的数据，进行预处理；步骤四：预处理后的数据导入到大数据分析模型中进行分析；本发明的有益效果是：数据清洗、特征选择、特征缩放、数据变换、数据集拆分后的数据导入到大数据分析模型中进行分析，减少干扰，提高数据分析的精准；分析后的数据存储在存储库中，并可根据输入的关键字查找对应数据，还可将查找的对应数据导出，进一步增加使用的便利，提高使用时的体验感。
用于自动求解数学题目的相关方法和装置  用于自动求解数学题目的相关方法和装置 
 本披露公开了一种用于自动求解数学题目的相关方法和装置。本披露的一些实施例通过将数学题目的自然语言分为两部分以先后用不同方式将其转换为形式化语言，可更简单且精确地为数学题目构建易于机器理解的表示。所述转换的形式化语言进而由本披露的一些实施例通过使用通用人工智能大模型来分析，可更轻松准确地理解题意，从而促进所述大模型对题目的自动求解。
一种面向连续干扰的体系韧性评估方法及装置  一种面向连续干扰的体系韧性评估方法及装置 
 本发明提供一种面向连续干扰的体系韧性评估方法及装置，方法包括:获取当前使命任务数量和作战体系组成，构建基于作战环的作战体系作战网络模型，其中作战体系组成包括实体种类、数量、性能和作战实体间关联关系；求解作战体系作战网络性能，其中主要包括计算作战环性能、计算作战体系作战网络性能；作战体系韧性评估，其中主要包括构建作战体系韧性评估模型，计算作战体系韧性。该方法实现了作战体系在受到连续干扰后性能即时损失和恢复过程中性能的量化分析，对于优化作战体系作战网络结构、提高作战体系性能具有非常重要的意义，进而有效维护国防安全和国家利益。
一种大型风电机组气动性能现场历史演化行为分析方法  一种大型风电机组气动性能现场历史演化行为分析方法 
 本发明公开了一种大型风电机组气动性能现场历史演化行为分析方法，将功率系数作为气动性能现场分析的基本指标，采用数据补偿和数据滤波克服SCADA风速数据“偏差性”和“随机性”两个不利因素的影响。将风速和风轮转速之间的关系视为惯性系统，并提出数据驱动时间常数确定法。设计了符合实际的计算工况区域划分算法，采用数据分箱方法和“保守”数据对比法分别解决了工况划分时需要解决的散点数据“单值化”和区间临界值确定的问题。然后，分别计算了基于瞬时功率和累积功率的功率系数。以四个指标多角度观测算法的有效性，分别给出了两台机组5年劣化度，描述了机组现场气动性能的历史演化，结果表明所提方法有效可行。
一种热管式复合抛物槽式集热系统跟踪策略计算方法  一种热管式复合抛物槽式集热系统跟踪策略计算方法 
 本发明公开一种热管式复合抛物槽式集热系统跟踪策略计算方法，包括:步骤(1)、确定热管式复合抛物槽式集热系统的结构和光学参数；步骤(2)、定义初始光线的入射角和光线位置；步骤(3)、判断光线是否进入聚光器开口平面，以及是否落在接收器上；步骤(4)、根据步骤(3)的判断结果计算光线与接收器的交点，并统计已吸收光线在接收器上的落点分布；步骤(5)、计算并比较不同跟踪方式下接收器能流密度分布和集热器光学效率，确定热管式复合抛物槽式集热系统跟踪策略。本发明可以解决现有的集热系统跟踪策略的计算方法不适用于倾斜放置热管式复合抛物槽式集热系统的技术问题。
一种基于仿生算法的基学习器动态组合方法、装置和介质  一种基于仿生算法的基学习器动态组合方法、装置和介质 
 本发明提供了一种基于仿生算法的基学习器动态组合方法、装置和介质，属于分类预测技术领域。通过以下技术方案实现:划分数据集，并确定待选学习器集合，使用数据集训练学习器；初始化种群，所述种群中个体为训练完成的待选学习器组成的列表；计算当前种群中的每个个体的适应度值；通过进化操作产生新的个体，并将新的个体与种群合并，得到新的种群；迭代上述步骤直至满足终止条件停止迭代，根据最终的适应度值，选出最优的个体作为最终的待选学习器组合。本发明通过仿生算法自动搜索潜在的基学习器组合，提高了搜索的效率，减轻了人工选择的负担。
一种电池极片双辊压设备状态预测系统及实现方法  一种电池极片双辊压设备状态预测系统及实现方法 
 本发明属于电池极片设备检测技术领域，具体的说是一种电池极片双辊压设备状态预测系统及实现方法；其方法包括以下步骤:S1：获取双辊压设备的振动数据并进行特征提取；S2：将振动数据分为训练集振动数据和测试集振动数据，且所述训练集振动数据和测试集振动数据均为二维时空序列数据；S3：选择CNN‑BiGRU网络，并将S2中的训练集振动数据应用到CNN‑BiGRU网络中，得到训练后的CNN‑BiGRU模型；S4：利用S3中训练后的CNN‑BiGRU模型并通过S2中的测试集振动数据进行双辊压设备的状态预测；本发明通过将CNN模块与BiGRU模块进行融合，有效的结合CNN的局部特征提取能力和BiGRU在处理时间序列数据上的优势，从而大大提高双辊压设备状态预测的准确性以及效率。
算力网络环境下基于强化学习的多维资源的任务调度方法  算力网络环境下基于强化学习的多维资源的任务调度方法 
 本发明公开一种算力网络环境下基于强化学习的多维资源的任务调度方法，属于多维资源任务调度领域。本发明包括云计算环境中的用户通过云计算平台提交请求，云计算平台对用户请求的处理、对任务的分解，建立多维资源的强化学习模型，训练多维资源的强化学习模型，基于强化学习实现多维资源任务调度。本发明通过强化学习方法，根据任务和资源的实时状态，动态地进行多维资源的任务分配和资源调度，提升云计算平台响应速度，减少云计算平台能耗，提高云计算平台的资源利用率以及任务完成时间。
基于地理时空加权回归的水源涵养影响因素分析方法  基于地理时空加权回归的水源涵养影响因素分析方法 
 本发明公开了基于地理时空加权回归的水源涵养影响因素分析方法，包括步骤:采集目标流域的影响因素数据作为第一数据集；计算目标区域的历史水源涵养值，并进行空间聚合分析作为第二数据集；利用多尺度地理加权回归法对第一数据集和第二数据集进行空间模式分析，得到各类影响因素的空间特征；利用地理时空加权回归法对第一数据集和第二数据集进行时空变化分析，得到各类影响因素的时空特征；根据空间特征和时空特征，得到各类影响因素对目标流域水源涵养的影响特征。本发明捕捉到影响因素在不同空间尺度上的变化特征，揭示这些因素随时间的变化趋势，确保分析的全面性，综合空间和时间两个维度的数据，预测和分析的结果更为精确。
一种综合能源服务电力交易方法及系统  一种综合能源服务电力交易方法及系统 
 本发明涉及电力数据交易技术领域，尤其涉及一种综合能源服务电力交易方法及系统。所述方法包括以下步骤:获取电力使用数据；对电力使用数据进行消费者行为模式图谱构建，生成消费者能源使用行为模式图谱；通过消费者能源使用行为模式图谱对标准电力使用数据进行综合能源需求预测，生成消费者综合能源需求预测数据；基于消费者综合能源需求预测数据进行区块链能源交易平台构建，生成区块链能源交易合约。本发明通过个性化能源需求预测、区块链交易平台构建、电能类型分析、波动响应策略、自动交易监控和数据可视化，提高了电力交易的灵活性和效率性。

技术分类

电信、广播电视和卫星传输服务电信、广播电视和卫星传输服务

互联网软件服务互联网软件服务

集成电路设计集成电路设计

信息集成数字服务信息集成数字服务

电气机械制造电气机械制造

计算机、通信、电子设备制造计算机、通信、电子设备制造

医药制造、生物基材料医药制造、生物基材料

石油煤矿化学用品加工石油煤矿化学用品加工

化学原料制品加工化学原料制品加工

非金属矿物加工非金属矿物加工

金属制品加工金属制品加工

专用设备制造专用设备制造

通用设备制造通用设备制造

通用零部件制造通用零部件制造

汽车制造业汽车制造业

铁路、船舶、航天设备制造铁路、船舶、航天设备制造

电力、热力生产和供应电力、热力生产和供应

燃气生产和供应燃气生产和供应

水生产和供应水生产和供应

房屋建筑、土木工程房屋建筑、土木工程

交通运输、仓储和邮政交通运输、仓储和邮政

农、林、牧、渔业农、林、牧、渔业

采矿业采矿业

农副、食品加工农副、食品加工

烟草、酒水加工烟草、酒水加工

纺织皮具居家制品纺织皮具居家制品

文教体娱加工文教体娱加工