https://www.zhuanzhi.ai/paper/768286ecd0f0213c3949bbe1ddab112c
多跳知识库问题回答(KBQA)的目的是找到与问题中的实体在知识库中有多个跃点的答案实体。一个主要挑战是中间步骤缺乏监督信号。因此,多跳KBQA算法只能接收最终答案的反馈,这使得学习不稳定或无效。
为了解决这一挑战,我们提出了一种新的教师-学生多跳KBQA任务方法。在我们的方法中,学生网络的目标是找到问题的正确答案,而教师网络试图学习中间监督信号,以提高学生网络的推理能力。主要的新颖之处在于教师网络的设计,我们利用了正向和逆向推理来增强中间实体分布的学习。通过考虑双向推理,教师网络可以产生更可靠的中间监督信号,从而缓解虚假推理的问题。在三个基准数据集上的大量实验证明了我们的方法在KBQA 任务上的有效性。