在许多数据科学应用中,如推荐系统、在线广告、医疗等,对表格数据进行预测是一项重要的任务。表格数据被结构成行和列,每一行作为数据样本,每一列作为特性属性。表格数据的列和行都带有可以提高模型预测性能的有用模式。然而,大多数现有模型关注的是跨列模式,而忽略了跨行模式,因为它们独立处理单个样本。在这项工作中,我们提出了一个通用的学习框架,名为检索与交互机(RIM),它充分利用表格数据中的横行和横列模式。具体来说,RIM首先利用搜索引擎技术高效地检索表中有用的行来辅助目标行标签预测,然后利用特征交互网络捕捉目标行与被检索行之间的跨列模式,从而做出最终的标签预测。我们对三个重要任务的11个数据集进行了广泛的实验,即CTR预测(分类)、top-n推荐(排名)和评分预测(回归)。实验结果表明,RIM在不同的基准上取得了显著的改进,证明了RIM的优越性和有效性。
https://www.zhuanzhi.ai/paper/753ed3f1b041ebbb1c804ed9f67590dd