机器之心发布
机器之心编辑部
仅从一个人的抖音、快手、腾讯视频的观看记录里,我们能发现什么?近日,腾讯看点研发团队、Google London 和中科大的研究工作首次证实,仅依靠用户视频新闻观看记录,就可以精确地推测出用户的各种个人信息信息,包括但不限于用户年龄段、性别、喜好、人生状况(例如单身/已婚/怀孕等)、职业、学历等信息,甚至是否有心理抑郁暴力倾向。目前,这篇论文已经被信息检索领域顶级国际会议 SIGIR 接受为长文章。
构造一个有效的预训练模型,能够建模超长用户点击序列;
设计一种微调策略,能够将预训练网络适配到下游任务。目前为止,没有相关文献证实这种无监督学习的用户表征是否对其他场景有帮助;
设计一个适配方法,能够使得不同任务都能充分利用预训练网络参数,从而不需要微调整个网络,达到更加高效的迁移学习方式。
提出了一种通用用户表征学习架构,首次证实采用无监督或者自监督的预训练网路学习用户点击行为可以内用来推测用户的属性信息。这一发现将有望改进很多公共服务,带来更大的商业利润,同时也会引发甚至推动对于隐私保护的相关问题的研究;
提出了一种非常有效的模型补丁网络,网络相对于原来的空洞卷积层参数量更小,但是具有同等表达能力;
提出了两种模型补丁的插入方式,并行插入和串行插入;
提出了很多趋势洞察,可能会成为该领域未来的一些研究方向;
后续将会开源代码和一些高质量的数据集,从而推动推荐系统领域迁移学习的研究,建立相关基准。