人工智能模型预训练技术、系统、介质及软件产品
2025-02-12 15:11
No.1339252585701580800
技术概要
PDF全文
本技术涉及人工智能领域,特别是自然语言处理和深度学习技术。提供了一种模型预训练技术,包括装置、设备、存储介质和程序产品。该技术通过特定方法实现,旨在提升模型性能和应用范围。
背景技术
近年来随着自然语言处理技术的不断发展,基于大语料和大规模参数的生成式预训练语言模型(如GPT3(General Pre-trained Transformer-3,第三代通用预训练转换器)等)逐渐走入人们的视野。这些模型无需进行微调就可以给予输入的各种前缀和提示生成丰富的文本,可以被广泛应用于问答、写作、对话等各种领域。 然而,现有的生成式预训练模型生成的内容相较于自然语言依然存在例如用词不当、前后矛盾、语言重复等等问题。
实现思路
阅读余下40%
技术概要为部分技术内容,查看PDF获取完整资料
该技术已申请专利,如用于商业用途,请联系技术所有人!
技术研发人员:
赵晏彬丁思宇王硕寰尚骏远孙宇
技术所属: 北京百度网讯科技有限公司.
相关技术
一种散热计算机机箱 一种散热计算机机箱
一种基于申威威鑫3231处理器的计算机系统核心处理模块 一种基于申威威鑫3231处理器的计算机系统核心处理模块
一种带有射频标签手术器械自动识别装置 一种带有射频标签手术器械自动识别装置
一种具有防撞功能的计算机机箱 一种具有防撞功能的计算机机箱
计算机及飞行器 计算机及飞行器
一种基于用户画像的商品推荐方法及系统 一种基于用户画像的商品推荐方法及系统
一种适用于大数据处理的计算机设备 一种适用于大数据处理的计算机设备
光纤电流传感器的非线性误差建模方法、介质及电子设备 光纤电流传感器的非线性误差建模方法、介质及电子设备
一种数据处理方法、系统及电子设备 一种数据处理方法、系统及电子设备
一种基于氮化硼的电容式柔性触摸屏及其制备方法 一种基于氮化硼的电容式柔性触摸屏及其制备方法
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工
苏ICP备18062519号-5 © 2018-2025 【123技术园】 版权所有,并保留所有权利