本技术公开了一种基于大语言模型的知识追踪冷启动优化方法及系统,属于知识追踪领域。该方法首先获取在线学习平台的学生答题记录,构造提示模板让大语言模型输出解题步骤、标注知识概念,并生成解题步骤与知识概念的二元配对关系。然后,将问题和知识概念作为异构图节点,建立边连接并生成语义嵌入向量。接着,使用异构图编码器结合图注意力网络和跳跃知识机制,输出知识概念和问题的最终节点嵌入。最后,通过对比学习训练答题预测模型,预测学生对目标问题的回答。该方法有效提升了在线学习平台上知识追踪冷启动阶段的性能和准确性。
背景技术
知识追踪(Knowledge Tracing)是个性化教育系统中的核心任务,其目标是通过分析在线学习平台上学生与问题的交互记录,动态预测学生对知识点的掌握程度,并进一步辅助学习路径规划与个性化推荐。近年来,随着深度学习的发展,基于神经网络的知识追踪模型(如DKT、DKVMN等)取得了显著进展。这些模型通过编码学生的历史交互数据,学习知识点的时序掌握动态,能够有效提升预测的准确性。
然而,这些基于ID的方法通常依赖于在线学习平台上大量学生与问题的交互记录来训练模型,从而面临冷启动问题的严峻挑战。冷启动主要表现为两方面:一是新问题缺乏足够的学生交互数据,导致模型难以准确估计其难度或知识点关联性;二是新知识点的引入,使得模型无法充分学习与之相关的语义特性。这种数据稀疏性不仅降低了模型对新习题或知识点的预测能力,还可能影响整体系统的泛化性能。因此,对于在线学习而言,如何有效缓解冷启动问题成为知识追踪领域亟待解决的核心难题。
实现思路