本技术涉及一种文本重构技术,适用于人工智能和自然语言处理领域。该技术通过文本编码模块对原始文本进行处理,产生多个候选文本,并通过相似度评估模块比较候选文本与原始文本的相似度,最终输出与原始文本语义相似度最高的候选文本。
背景技术
随着人工智能技术的发展,在线智能问答系统在电商、教育、政务、金融等应用场景中得到了广泛应用。线智能问答系统基于用户问题与语料库中预先准备好的标准问题进行文本相似度匹配,将与用户问题最相似的标准问题的答案作为在线智能问答系统的应答结果。为了在智能问答系统上线初期能构建出丰富的、多样性高的语料库,可以利用问题复述生成方法,将标准问题文本生成复述问题文本,以扩充语料库中标准问题的相似问题,以提高冷启动情况下,在线智能问答系统所对应的语料库的丰富性和多样性。
在实现本公开构思的过程中,发明人发现相关技术中至少存在如下问题:根据标准问题文本生成的复述问题文本准确性较低,导致复述问题文本的可用性较差。
实现思路