本技术提供一种场景问答模型生成方法及装置,涉及人工智能技术领域。所述方法包括:获取各个预设性格类型对应的多个样本问答对;针对每个所述预设性格类型,使用所多个样本问答对训练基础模型,得到预设性格类型对应的性格模型;利用性格模型生成场景问题对应的场景答复,并基于场景答复获取所述性格模型的偏好分数;基于每个性格模型的偏好分数,将所有性格模型融合为指定场景下的目标问答模型。本发明融合得到的目标问答模型在回答指定场景中的问题时,可给出更加符合用户偏好的回答,可有效提升问答模型在指定场景中的对话自然度。
背景技术
随着人工智能技术的快速发展,在自然语言处理领域,智能问答成为研究和应用的热点。智能问答旨在通过模拟人类的交流方式,为用户提供更加自然且符合用户需求的问答体验。
为了实现这一目标,通常使用偏好对齐的方式使得模型的输出符合人类的期望和偏好。人类偏好对齐是指让大语言模型的能力和行为与人类的价值、真实意图和伦理原则相一致,确保人类与人工智能协作过程中的安全与信任。然而,目前的偏好对齐仅适用于通用型语言模型或通用型任务,在特定场景下,由于缺乏对行业特定知识的理解以及对用户个性化需求的适应能力,模型的输出难以符合用户的期望和偏好,导致在特定场景下的对话自然度和质量较差。
实现思路