一种优化大语言模型对齐技术及应用

123技术园

首页 / 技术内容

一种优化大语言模型对齐技术及应用

2025-02-15 10:45

No.1340272821359878144

技术概要

PDF全文

本技术涉及一种优化的大语言模型对齐技术，旨在提高模型在特定任务中的性能。该技术首先加载预训练的大语言模型，并将其设置为文本补全模式。接着，针对特定的目标数据集，执行模型特征的检索，以识别至少一个关键特征。通过这一过程，模型能够更精准地对齐目标数据集，从而提升处理效率和准确性。

背景技术

大语言模型(Large Language Mode l s，LLMs)是一类能够理解和生成自然语言文本的深度学习模型，在语言理解、文本生成、问答系统等领域展现出了巨大的潜力，这些模型在预训练阶段通过大规模的文本数据进行学习，然后在特定任务上进行微调，以实现更加精确和具体的语言理解和生成，而大语言模型对齐是指导大语言模型学习人类交互偏好、跟随人类指令以及不生成有害文本的过程。在相关技术中，对齐方法通常依赖额外的人工数据和微调训练来实现指令跟随等，如监督微调(Supervi sed Fine-Tun ing，SFT)和人类反馈强化学习(ReinforcementLearn ing from Human Feedback，RLHF)。这些方法需要大量的人工干预和繁琐的训练过程，导致了模型对齐成本较高、效率较低的问题。

实现思路

阅读余下40%

技术概要为部分技术内容，查看PDF获取完整资料

该技术已申请专利，如用于商业用途，请联系技术所有人！

技术研发人员：

胡景钊毕文静张一帆刘抚忠李青山褚华王璐

技术所属：西安电子科技大学

相关技术

适用于硬件电路的高精度压缩方法、装置及电子设备 适用于硬件电路的高精度压缩方法、装置及电子设备
本发明提供一种适用于硬件电路的高精度压缩方法、装置及电子设备，应用于图像处理技术领域，该方法包括:获取目标图像；将所述目标图像输入卷积神经网络模型；输出所述目标图像对应的图像类别；其中，该卷积神经网络模型是基于不同类别的图像训练得到的、经过压缩的神经网络模型，该卷积神经网络模型的每个卷积层中包括至少一组卷积核参数为卷积核共享参数。
问题解答方法、装置、介质和电子设备 问题解答方法、装置、介质和电子设备
本公开提供了一种问题解答方法、装置、介质和电子设备，所述方法包括:获取第一客户终端传送的第一解答请求；对所述问题音频进行音频语义分析，从所述问题音频中获得至少两个问题关键词；基于所述至少两个问题关键词对知识集进行匹配搜索，获得第一搜索结果；响应于不存在所述第一搜索结果，至少基于所述问题音频生成第二解答请求；将所述第二解答请求传送至第二客户终端，以便获得响应所述第二解答请求的解答信息，并传送至所述第一客户终端。从而降低了答疑教师的工作量，使复习者提出的问题能够及时解答，提高了答疑效率，也提高了复习者的复习效率。
一种离心式空压机热能管理方法及系统 一种离心式空压机热能管理方法及系统
本发明涉及人工智能技术领域，本发明涉及一种离心式空压机热能管理方法及系统，包括:首先，基于历史数据中离心式空压机运行参数数据与排气口温度数据训练神经网络模型，得到训练好的神经网络模型，用于预测排气口温度数据；然后，对预测的排气口温度数据进行分类得到多个温度类别，从历史数据库中查找各温度类别对应的初始冷却水流速、冷却水冷却效率、冷却油流速和冷却油冷却效率；确定实时排气温度所属的温度类别，并根据实时排气温度和稳态温度之间的温度偏差动态调整冷却水和冷却油的流速，以确保系统温度达到预设的稳态温度。本发明解决了对离心式空压机热能的精准控制问题。
铁尾矿与煤矸石协同磁化焙烧回收铁及活性提升优化方法  铁尾矿与煤矸石协同磁化焙烧回收铁及活性提升优化方法 
 本发明属于固废处理技术领域，具体公开了铁尾矿与煤矸石协同磁化焙烧回收铁及活性提升优化方法，包括如下步骤:S1：以磁化焙烧中的煤矸石掺量、碳粉掺量、加热温度、加热时间为影响因素，以还原铁粉的铁品位与铁回收率以及尾渣活性指数为响应值，设计响应面试验方案；S2：将铁尾矿、煤矸石与碳粉混合，进行磁化还原焙烧、球磨、磁选，回收还原铁粉，测试其铁品位与铁回收率；S3：测试尾渣活性指数；S4：建立三个响应值的响应面模型，验证模型可靠性；S5：获得同时满足三个响应面模型的多目标优化需求条件的优化技术方案。实现了铁尾矿的还原铁粉与尾渣的应用价值的协同提高，提高了铁尾矿处理产物的整体收益，实现了固废协同处置。
触控基板、显示装置 触控基板、显示装置
本公开提供一种触控基板、显示装置。所述触控基板包括:触控区域和包围触控区域的周边区域；触控基板还包括：相耦接的触控电极和触控信号线；所述触控电极的至少部分位于所述触控区域；所述触控信号线的至少部分位于所述周边区域，所述触控信号线包括依次首尾相接的第一部分，第二部分和第三部分，所述第一部分和所述第三部分的延伸方向相同，所述第二部分的至少一个边的延伸方向与所述第一部分的延伸方向相交；所述第二部分在垂直于所述至少一个边的延伸方向上的宽度，大于所述第一部分在垂直于其自身延伸方向上的宽度；和/或，大于所述第三部分在垂直于其自身延伸方向上的宽度。
兴趣面冲突处理方法、兴趣面展示方法、装置及电子设备 兴趣面冲突处理方法、兴趣面展示方法、装置及电子设备
本申请实施例提供兴趣面冲突处理方法、兴趣面展示方法、装置、电子设备以及计算机存储介质，其中，兴趣面冲突处理方法能够检测出覆盖区域相互冲突的多个冲突兴趣面，并对多个冲突兴趣面中的冲突区域图像进行碎片化处理，并为碎片化处理后的多个冲突区域图像分配归属兴趣面，归属兴趣面为多个冲突兴趣面中的兴趣面，进而最终能够基于多个冲突区域碎片图像对应的归属兴趣面信息，确定对应于多个冲突兴趣面的更新兴趣面，进而该方法使得最终确定的更新兴趣面不存在冲突区域，从而能够便于基于更新兴趣面确定某个原来处于冲突区域的兴趣点归属的兴趣面。
基于历史文化的信息分析管理方法、系统、终端及介质 基于历史文化的信息分析管理方法、系统、终端及介质
本申请涉及基于历史文化的信息分析管理方法、系统、终端及介质，其方法包括依据生成指令获取历史名城的坐标，获取历史名人的名人信息及历史事件的事件信息；依据历史名城的坐标以及GIS地图生成名城分布图，于名城分布图上生成对应各历史名城的名城控件；获取名城控件的触发指令，依据太阳历生成时间轴；依据各历史名人的名人信息分别于时间轴上显示名人标识，依据各历史事件的事件信息于时间轴上显示事件标识，依据预设条件确定名人标识与事件标识在时间轴上的显示位置；获取名人标识的触发信号，显示名人信息；获取事件标识的触发信号，显示事件信息。本申请能以时间为脉络呈现历史名城所关联的历史名人与历史事件。
任务预测处理方法、设备、产品和介质 任务预测处理方法、设备、产品和介质
本公开实施例公开了一种任务预测处理方法、设备、产品和介质，针对待处理任务和多个候选任务执行者中的任一候选任务执行者，获取静态特征和时序特征；静态特征包括:任务特征，执行者特征和待处理任务的作用方特征；时序特征包括：在预设最近一个时间段内，候选任务执行者的行为特征和待处理任务的作用方的变化特征；利用神经网络模型，基于静态特征和时序特征，预测任一候选任务执行者完成多目标的综合概率，以便基于综合概率从多个候选任务执行者中确定待处理任务的任务执行者；其中，完成多目标包括：完成待处理任务且完成待处理任务的关联目标。本公开实施例可以提高任务完成和任务完成之后项目目标达成的综合效果。
一种散热性好的笔记本电脑外壳 一种散热性好的笔记本电脑外壳
本实用新型公开了一种散热性好的笔记本电脑外壳，涉及笔记本电脑技术领域，包括笔记本电脑主体外壳和散热柱，所述笔记本电脑主体外壳的后侧外壁连接有显示屏，所述笔记本电脑主体外壳的内部设置有导热板，所述散热柱固定连接于导热板的顶部外壁，所述导热板的底部外壁开设有主散热排孔和辅助散热排孔。该散热性好的笔记本电脑外壳，散热柱能够增加导热板与空气的接触面积，主散热排孔和辅助散热排孔以供空气进入笔记本电脑主体外壳的内部，以实现对笔记本电脑主体外壳的快速换热，笔记本电脑主体外壳的底部通过第一支撑架或第二支撑架进行撑高以至和桌面产生距离，能够保持空气的流通，有助于笔记本电脑主体外壳的散热。
一种基于大模型的考试试题生成方法 一种基于大模型的考试试题生成方法
本发明提供一种基于大模型的考试试题生成方法，属于人才考试测评领域。首先，从自有的考试数据库采集并预处理相关的题目信息和素材文本，构建高质量数据集；然后，构建基于Transformer自回归的命题大模型；其次，基于所构建的命题大模型制作训练数据集并对该模型进行微调训练；再次，将训练好的命题大模型部署在后台，实现自主生成适合测评考生的试题；最后，针对考试专家对命题大模型输出题目及其答案的人工反馈，进一步优化模型，实现闭环训练。经过以上步骤，该模型能根据题目要求实现高效、准确、客观的生成考试试题，提升人才评价智能化水平。

技术分类

电信、广播电视和卫星传输服务电信、广播电视和卫星传输服务

互联网软件服务互联网软件服务

集成电路设计集成电路设计

信息集成数字服务信息集成数字服务

电气机械制造电气机械制造

计算机、通信、电子设备制造计算机、通信、电子设备制造

医药制造、生物基材料医药制造、生物基材料

石油煤矿化学用品加工石油煤矿化学用品加工

化学原料制品加工化学原料制品加工

非金属矿物加工非金属矿物加工

金属制品加工金属制品加工

专用设备制造专用设备制造

通用设备制造通用设备制造

通用零部件制造通用零部件制造

汽车制造业汽车制造业

铁路、船舶、航天设备制造铁路、船舶、航天设备制造

电力、热力生产和供应电力、热力生产和供应

燃气生产和供应燃气生产和供应

水生产和供应水生产和供应

房屋建筑、土木工程房屋建筑、土木工程

交通运输、仓储和邮政交通运输、仓储和邮政

农、林、牧、渔业农、林、牧、渔业

采矿业采矿业

农副、食品加工农副、食品加工

烟草、酒水加工烟草、酒水加工

纺织皮具居家制品纺织皮具居家制品

文教体娱加工文教体娱加工