Factorization models express a statistical object of interest in terms of a collection of simpler objects. For example, a matrix or tensor can be expressed as a sum of rank-one components. However, in practice, it can be challenging to infer the relative impact of the different components as well as the number of components. A popular idea is to include infinitely many components having impact decreasing with the component index. This article is motivated by two limitations of existing methods: (1) lack of careful consideration of the within component sparsity structure; and (2) no accommodation for grouped variables and other non-exchangeable structures. We propose a general class of infinite factorization models that address these limitations. Theoretical support is provided, practical gains are shown in simulation studies, and an ecology application focusing on modelling bird species occurrence is discussed.


翻译:集成化模型表示对收集简单对象感兴趣的统计目标,例如,矩阵或强项可以以一等成分的总和表示,但在实践中,推断不同组成部分的相对影响以及组成部分的数目可能具有挑战性。流行的想法是包括影响随着组成指数下降的无限许多组成部分。这一条的动机是现有方法的两种局限性:(1) 缺乏对组成部分散居结构的仔细考虑;(2) 无法容纳组合变量和其他不可交换结构。我们提出了处理这些局限性的无限因子化模型的一般类别。提供了理论支持,模拟研究中显示了实际收益,并讨论了侧重于模拟鸟类物种发生情况的生态应用。

0
下载
关闭预览

相关内容

【干货书】机器学习速查手册,135页pdf
专知会员服务
125+阅读 · 2020年11月20日
【EMNLP2020】自然语言生成,Neural Language Generation
专知会员服务
38+阅读 · 2020年11月20日
【文本生成现代方法】Modern Methods for Text Generation
专知会员服务
43+阅读 · 2020年9月11日
专知会员服务
161+阅读 · 2020年1月16日
机器学习入门的经验与建议
专知会员服务
92+阅读 · 2019年10月10日
计算机类 | 11月截稿会议信息9条
Call4Papers
6+阅读 · 2018年10月14日
已删除
将门创投
5+阅读 · 2018年2月28日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Arxiv
11+阅读 · 2018年3月23日
Arxiv
7+阅读 · 2018年3月21日
VIP会员
相关资讯
计算机类 | 11月截稿会议信息9条
Call4Papers
6+阅读 · 2018年10月14日
已删除
将门创投
5+阅读 · 2018年2月28日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员