多跳问题优化：大语言模型推理问答技术

123技术园

首页 / 技术内容

多跳问题优化：大语言模型推理问答技术

2025-02-07 16:18

No.1337457563884855296

技术概要

PDF全文

本技术方案专注于提升大语言模型在多跳问题上的推理问答能力。旨在克服现有技术中推理准确度不足的问题，本技术通过一系列创新方法，显著提高大语言模型的推理准确性。

背景技术

在2022年11月openAI发布chatGPT以来，大语言模型迅速受到来自全球资本市场的广泛关注，在接下来不到两年的时间里，各家科技巨头公司纷纷跟进，提出自己的模型。在这场全球范围内的“百模大战”中，模型在复杂问题上的问题解决能力是评判模型综合能力最重要的指标之一。无论是国外OpenAI的GPT系列模型，还是国内百度的文心一言以及月之暗面的kimi，无一例外地在各种公开的推理评测数据集上刷新着模型得分数据，以证明自己的模型是否会比竞争对手的模型“更加聪明”。显而易见地，即使是目前最先进的GPT系列模型，它们在处理知识密集型多跳问题时仍然面临着一些挑战。这些问题不仅限制了模型的推理能力，也影响了其在实际应用中的可靠性和有效性。对于知识密集型的需要多跳推理的复杂问题，提升大语言模型的推理能力，有两个主要的方向，一个方向是针对提示词的改进策略，而另一个方向是对模型进行检索增强。提示词的改进策略中最著名的，莫过于Wei等人在2022年提出的思维链(CoT)提示，这促使LLM在最终回答之前生成推理过程，能够明显提高模型推理能力，提高回答的准确率。还有一些工作通过设计特定的指令或通过聚类演示来帮助模型在没有直接训练的情况下进行推理，即在零样本学习的场景下进行有效的任务执行。此外，通过广泛的实验证明，自我集成策略也是提高大模型推理性能的有效方法。具有代表性的方法有2023年Wang等人提出的使用概率抽样方法进行多条推理，以及在2023年Qin等人通过多语言思维链条来多样化推理路径。对于复杂问题的解决，有代表性的策略有2023年Zhou等人提出的问题分解并逐步解决的思想，以及同年Yao等人提出的将推理过程建模为在推理树上的BFS或DFS搜索的策略。目前最先进的大语言模型服务，在面对复杂问题时，除了提示词策略上的设置，还会同时使用检索增强推理的方法。尤其当模型面对知识敏感任务时，很可能会出现事实性幻觉的问题，检索增强推理的方法可以大大缓解这种现象。早期工作中大多采用单次检索的方案，但他们难以收集所有必要的知识来回答复杂问题，导致知识遗漏。为了解决这一问题，迭代检索的方法被进一步提出。在2022年Khattab等人提出DSP方案，该方案通过程序定义的过程在检索器和阅读器之间进行迭代交互。在2023年Press等提出SelfAsk方案，即通过Google搜索迭代地分解问题并解决它们。同样是在2023年Trivedi等提出了IRCoT方案，该方案使用每个推理步骤作为检索的查询，直到获得最终答案。类似地，2023年Shao等人提出了ITER-RETGEN方案，即通过将上一轮的输出与原始问题连接起来进行迭代检索。在2023年Jiang等人提出FLARE方案，该方案引入了前瞻机制，根据推理置信度动态控制检索的时机。2023年Zhang等人提出了Beam Retrieval方案，引入了一个端到端的框架，旨在通过波束搜索在每个问题的每一跳中检索相关段落。与此同时，一些工作通过将问题分解为QDMR格式来实现更精确的检索或者是将问题分解为树形结构，而在2023年Park等人则是通过构建了推理图来作为解决方案。然而，上述的策略仍然存在着显著的问题。迭代检索难以实现与模型推理精确对齐的检索，而子问题检索则难以准确聚合答案，这可能导致级联错误，即一个子问题的错误会导致整个问题的最终错误。此外，在开放域设置中，现有技术对于复杂问题仅依赖单一来源的知识，这会使得大语言模型对于某些领域的知识缺乏和不够全面，导致最终的推理答案依据不足，不够准确。但是，引入多源知识又可能会遇到知识冲突，使有效的协作变得困难，在推理的过程中，存在矛盾的外部辅助知识会严重影响模型的推理判断，导致最终结果输出的不稳定甚至完全错误。因此现有的大语言模型推理问答方法还存在面对多跳问题推理准确率低的问题。

实现思路

阅读余下40%

技术概要为部分技术内容，查看PDF获取完整资料

该技术已申请专利，如用于商业用途，请联系技术所有人！

技术研发人员：

刘铭王泽鑫初征陈靖昌秦兵

技术所属：哈尔滨工业大学

相关技术

一种计算机软硬件保护装置 一种计算机软硬件保护装置
本实用新型属于保护装置技术领域，具体地说是一种计算机软硬件保护装置，包括支撑管，所述支撑管顶部螺纹连接有螺纹柱；所述支撑管底部设有固定片；所述固定片顶部开设有一对固定孔；所述固定孔为对称设置；所述支撑管顶部固接有固定块；所述固定块中部开设有固定槽；所述固定槽内侧壁滑动连接有支撑管，通过在机箱底部的散热风扇上固定片，在固定片顶部安装有支撑管和螺纹柱组成的支撑装置，使得显卡被支撑装置支撑，即为显卡的另一端提供一个支撑点，从而有效地减少了发生弯曲形变的情况，进而有效地减少因显卡弯曲导致空焊或掉点的情况，以此达到对显卡保护的作用，从而有效地减少了显卡发生损坏的情况，提高显卡的使用寿命。
岗位画像生成方法、装置、及电子设备 岗位画像生成方法、装置、及电子设备
本申请公开了一种岗位画像生成方法、装置、及电子设备，属于数字化人才发展领域。所述方法包括:获取用户输入的第一信息，所述第一信息包括目标岗位的基础信息；根据所述第一信息，基于预设模型输出所述目标岗位的初始岗位画像；向所述目标岗位对应的目标校准用户发起岗位画像校准任务，并获取经所述岗位画像校准任务得到的校准数据；根据所述校准数据对所述初始岗位画像进行调整，得到目标岗位画像。
车辆升级方法、装置、车辆和可读存储介质 车辆升级方法、装置、车辆和可读存储介质
本发明提供了一种车辆升级方法、装置、车辆和可读存储介质，涉及车辆升级的技术领域，包括当获知用户的用车意图时，判断当前车辆正在升级的第一控制模块中是否具有目标控制类别，其中，目标控制类别与车辆驾驶性能相关；若存在，则查找与目标控制类别存在依赖性的第二控制模块，当第一控制模块和第二控制模块的升级完成时，控制当前车辆进行工作，缓解了车辆升级场景中用户的紧急用车问题。
表单对比方法、装置、计算机设备、存储介质及程序产品 表单对比方法、装置、计算机设备、存储介质及程序产品
本说明书实施方式提供一种表单对比方法、装置、计算机设备、存储介质及计算机程序产品，在根据待入库表单的表单信息在表单模板库中匹配到模板表单的情况下，在待入库表单的表单视图页面中提供表单对比控件，在表单对比控件被触发的情况下，展示对比页面，通过对比页面为用户直观地展示模板表单与待入库表单之间的对比信息，便于用户理解模板表单与待入库表单之间的不同之处或者相同之处，提升模板表单的生成效率。进一步地，通过直观地显示出模板表单与待入库表单的对比信息，降低用户操作成本，便于用户利用模板表单与待入库表单对表单模板库进行维护。
一种点钞机 一种点钞机
本发明公开了一种点钞机，包括:多个辊轴，以圆周等距排布，能够以一虚拟的中心轴线作旋转运动；圆槽，同轴心开设在辊轴内部；橡胶套，固定设置在圆槽内壁，分隔圆槽形成相互隔绝第一区域和第二区域；多个第一穿槽和第二穿槽，第一穿槽、第二穿槽分别与第一区域、第二区域相互连通设置；其中，对钞票分隔时，施加压力向整打钞票使其向多个辊轴之间的虚拟中心轴线方向移动，直至与任意一个辊轴相抵触，后多个辊轴旋转，旋转时，当第一穿槽接近于钞票时，第一区域形成负压。本发明通过采用负压相吸的方式使得整打钞票中相邻之间的钞票分隔，使得相邻之间的钞票不发生相对滑动，从而防止静电的产生，克服因静电相吸造成钞票非单张捻走的问题。
一种数据库数据处理方法、装置、系统及设备 一种数据库数据处理方法、装置、系统及设备
本发明提供一种数据库数据处理方法、装置、系统及设备，所述方法应用于中央处理器，包括:接收客户端请求，所述客户端请求是线程分发器根据客户端请求中的键值，分配到中央处理器的服务线程的；获取所述客户端请求对应的套接字，将所述套接字加入等待队列；根据等待队列中存在的套接字，将所述套接字分配至输入输出线程组进行解析处理，得到目标命令；执行所述目标命令，得到执行结果；将所述执行结果发送至输入输出线程组，通过所述输入输出线程组发送至客户端。本发明的方案可以提高数据库的数据处理速度和能力。
铁路轨道精捣方案生成方法、系统、装置、介质 铁路轨道精捣方案生成方法、系统、装置、介质
本申请涉及铁轨测量数据处理技术领域，具体为铁路轨道精捣方案生成方法、系统、装置、介质，首先根据实测的铁路轨道的所有里程值对应超高值，生成超高曲线，对超高曲线进行低通滤波处理和峰值滤波处理，得到精滤超高曲线；然后，将精滤超高曲线中关键波峰区域对应曲线作为待处理曲线，并获取直缓点、缓直点、缓圆点和圆缓点，形成平曲线设计资料；最后，基于平曲线设计资料，设计准确的轨道设计曲线；并基于轨道设计曲线和实测资料，设计平曲线实测偏差曲线和平曲线目标曲线，将平曲线目标曲线与平曲线实测偏差曲线的差值曲线，作为铁路轨道的平曲线起道量曲线，对铁路轨道进行精捣处理。
一种基于动态语义融合的多模态数据增强方法 一种基于动态语义融合的多模态数据增强方法
本发明公开了一种基于动态语义融合的多模态数据增强方法，包括以下步骤:S1、多模态数据搜集与预处理；S2、动态背景、属性与动作生成；S3、语义融合与增强；S4、多视角和多场景合成；S5、自监督训练与反馈机制；S6、动态调整与优化；通过创新的动态背景生成、属性与动作调整、语义融合及多视角场景合成技术，结合自监督训练和反馈机制，从而不但能够生成真实、多样且语义一致的数据样本，为深度学习模型提供了更全面的训练基础，而且通过动态调整数据增强策略，从而适应不同的训练需求和应用场景。
频率调整方法、装置、设备、程序介质及芯片  频率调整方法、装置、设备、程序介质及芯片 
 本发明公开了一种频率调整方法、装置、设备、程序介质及芯片；上述频率调整方法中，通过在获得电子设备的处理器在运行状态下的当前工作参数以及存储器的当前频率后，根据当前工作参数以及存储器的当前频率，获得处理器的第一目标频率，以及根据第一目标频率以及处理器的当前负载，获得存储器的第二目标频率，进而根据第一目标频率调整处理器的频率，以及根据第二目标频率调整存储器的频率，从而实现在针对处理器的目标频率进行计算时，综合考虑缓存和/或内存的频率对处理器的执行效率的影响，即实现对处理器和内存的频率的联动调节，能够综合考虑缓存和/或内存的频率对CPU性能的影响，在保证性能的基础上降低功耗。
一种DNA半减器的设计方法及DNA半减器  一种DNA半减器的设计方法及DNA半减器 
 本发明涉及DNA计算技术领域，公开了一种DNA半减器的设计方法及DNA半减器。该方法包括:获取一条长DNA单链与两条短DNA单链；基于DNA碱基互补配对原理，对一条长DNA单链与两条短DNA单链同时进行互补杂交，得到一个具有两个脚趾域的DNA三链复合结构，并将该类DNA三链复合结构作为一个与门逻辑块；将两个与门逻辑块并联，形成一个异或逻辑电路；将一个异或逻辑电路与一个与门逻辑块并联，形成DNA半减器。本发明的DNA半减器结构稳定，且设计过程不需要生物酶的参与，工作机制简单且使用成本较低。

技术分类

电信、广播电视和卫星传输服务电信、广播电视和卫星传输服务

互联网软件服务互联网软件服务

集成电路设计集成电路设计

信息集成数字服务信息集成数字服务

电气机械制造电气机械制造

计算机、通信、电子设备制造计算机、通信、电子设备制造

医药制造、生物基材料医药制造、生物基材料

石油煤矿化学用品加工石油煤矿化学用品加工

化学原料制品加工化学原料制品加工

非金属矿物加工非金属矿物加工

金属制品加工金属制品加工

专用设备制造专用设备制造

通用设备制造通用设备制造

通用零部件制造通用零部件制造

汽车制造业汽车制造业

铁路、船舶、航天设备制造铁路、船舶、航天设备制造

电力、热力生产和供应电力、热力生产和供应

燃气生产和供应燃气生产和供应

水生产和供应水生产和供应

房屋建筑、土木工程房屋建筑、土木工程

交通运输、仓储和邮政交通运输、仓储和邮政

农、林、牧、渔业农、林、牧、渔业

采矿业采矿业

农副、食品加工农副、食品加工

烟草、酒水加工烟草、酒水加工

纺织皮具居家制品纺织皮具居家制品

文教体娱加工文教体娱加工