数据增强驱动的大规模事件抽取模型构建技术
2025-02-16 12:21
No.1340659301206990848
技术概要
PDF全文
本技术方案提出了一种依托于数据增强的大规模事件抽取模型构建方法,属于数据处理技术领域。该方法涵盖了确立事件数据集的事件标注框架和相关第一提示词,其中第一提示词涵盖了事件抽取任务的界定。
背景技术
事件抽取是信息抽取领域一个重要且富有挑战性的子任务,旨在从非结构化的文本中抽取出结构化的事件信息,主要包括事件触发词、事件类别、事件论元等。事件抽取在自动文摘、自动问答、信息检索、知识图谱构建等领域有着广泛的应用。 目前,事件抽取主要依赖人工标注数据,导致相关应用成本高昂。事件抽取是一项复杂的任务,需要对文本进行细致的标注。传统的事件抽取标注通常涉及到多个层次的结构,包括事件范围的识别、事件触发词识别、事件类型分类以及事件论元识别等。这些标注任务均需要人工参与,耗时且费力。由于标注数据的复杂性,标注过程容易出现不一致性和主观性,导致难以建立高质量的标注数据集。此外,标注数据的成本也是一个重要的问题。由于事件抽取标注需要专业的领域知识和语言理解能力,导致了人工标注数据的获取成本非常高昂。然而,由于事件抽取任务的内在复杂性,相关的有监督事件抽取大模型需要大量有标注训练数据才能达到可用水平,目前主要依赖人工标注数据,这也导致在现实世界中开发事件抽取相关的应用成本高昂。
实现思路
阅读余下40%
技术概要为部分技术内容,查看PDF获取完整资料
该技术已申请专利,如用于商业用途,请联系技术所有人!
技术研发人员:
张世琨  叶蔚  谢睿
技术所属: 北京大学
相关技术
FPGA实现硬件逻辑实时仿真的方法及装置 FPGA实现硬件逻辑实时仿真的方法及装置
基于API和数据库的动态标定方法 基于API和数据库的动态标定方法
一种虚拟机的沙箱引擎更新方法、装置、设备和介质 一种虚拟机的沙箱引擎更新方法、装置、设备和介质
频域响应仿真与测量数据处理方法及装置 频域响应仿真与测量数据处理方法及装置
服务数据节点迁移方法、装置、电子设备及存储介质 服务数据节点迁移方法、装置、电子设备及存储介质
配送控制方法、装置、服务器、智能柜及机器人 配送控制方法、装置、服务器、智能柜及机器人
适用于硬件电路的高精度压缩方法、装置及电子设备 适用于硬件电路的高精度压缩方法、装置及电子设备
融合多源信息的打击目标智能识别方法和系统 融合多源信息的打击目标智能识别方法和系统
水利对象关联关系建立方法 水利对象关联关系建立方法
问题解答方法、装置、介质和电子设备 问题解答方法、装置、介质和电子设备
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工
苏ICP备18062519号-5 © 2018-2025 【123技术园】 版权所有,并保留所有权利