Gibbs-type priors are widely used as key components in several Bayesian nonparametric models. By virtue of their flexibility and mathematical tractability, they turn out to be predominant priors in species sampling problems, clustering and mixture modelling. We introduce a new family of processes which extend the Gibbs-type one, by including a contaminant component in the model to account for the presence of anomalies (outliers) or an excess of observations with frequency one. We first investigate the induced random partition, the associated predictive distribution and we characterize the asymptotic behaviour of the number of clusters. All the results we obtain are in closed form and easily interpretable, as a noteworthy example we focus on the contaminated version of the Pitman-Yor process. Finally we pinpoint the advantage of our construction in different applied problems: we show how the contaminant component helps to perform outlier detection for an astronomical clustering problem and to improve predictive inference in a species-related dataset, exhibiting a high number of species with frequency one.


翻译:Gibs类型前置物被广泛用作巴伊西亚若干非参数模型中的关键组成部分。 由于其灵活性和数学可移动性, 它们在物种取样问题、 集群和混合建模方面成为主要的先导。 我们引入了一个新的过程, 将Gibbs型的流程扩大为一类, 将污染物元件纳入模型, 以说明是否存在异常( 异常) 或超常观测频率之一。 我们首先调查诱发的随机分区、 相关的预测分布, 并描述组群数的无规律行为。 我们获得的所有结果都是封闭形式和容易解释的, 值得注意的例子就是我们集中关注受污染的Pitman- Yor 进程版本。 最后, 我们指出我们构建过程在不同应用问题的优势: 我们展示了污染物元件是如何帮助对天文群集问题进行外部检测, 并改进与物种有关的数据集的预测性推导力, 展示了高频一的物种数量 。

0
下载
关闭预览

相关内容

可靠深度异常检测,34页ppt,Google Balaji Lakshminarayanan讲解
【WWW2021】张量时间序列网络
专知会员服务
44+阅读 · 2021年4月20日
专知会员服务
26+阅读 · 2021年4月2日
【AAAI2021】记忆门控循环网络
专知会员服务
50+阅读 · 2020年12月28日
最新《联邦学习Federated Learning》报告,Federated Learning
专知会员服务
89+阅读 · 2020年12月2日
【干货书】机器学习速查手册,135页pdf
专知会员服务
126+阅读 · 2020年11月20日
因果图,Causal Graphs,52页ppt
专知会员服务
248+阅读 · 2020年4月19日
灾难性遗忘问题新视角:迁移-干扰平衡
CreateAMind
17+阅读 · 2019年7月6日
IEEE | DSC 2019诚邀稿件 (EI检索)
Call4Papers
10+阅读 · 2019年2月25日
逆强化学习-学习人先验的动机
CreateAMind
16+阅读 · 2019年1月18日
【NIPS2018】接收论文列表
专知
5+阅读 · 2018年9月10日
【SIGIR2018】五篇对抗训练文章
专知
12+阅读 · 2018年7月9日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
【学习】(Python)SVM数据分类
机器学习研究会
6+阅读 · 2017年10月15日
【推荐】决策树/随机森林深入解析
机器学习研究会
5+阅读 · 2017年9月21日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Arxiv
0+阅读 · 2021年10月18日
Arxiv
0+阅读 · 2021年10月15日
Arxiv
0+阅读 · 2021年10月14日
Arxiv
0+阅读 · 2021年7月7日
Type-augmented Relation Prediction in Knowledge Graphs
Arxiv
4+阅读 · 2018年1月15日
VIP会员
相关VIP内容
可靠深度异常检测,34页ppt,Google Balaji Lakshminarayanan讲解
【WWW2021】张量时间序列网络
专知会员服务
44+阅读 · 2021年4月20日
专知会员服务
26+阅读 · 2021年4月2日
【AAAI2021】记忆门控循环网络
专知会员服务
50+阅读 · 2020年12月28日
最新《联邦学习Federated Learning》报告,Federated Learning
专知会员服务
89+阅读 · 2020年12月2日
【干货书】机器学习速查手册,135页pdf
专知会员服务
126+阅读 · 2020年11月20日
因果图,Causal Graphs,52页ppt
专知会员服务
248+阅读 · 2020年4月19日
相关资讯
灾难性遗忘问题新视角:迁移-干扰平衡
CreateAMind
17+阅读 · 2019年7月6日
IEEE | DSC 2019诚邀稿件 (EI检索)
Call4Papers
10+阅读 · 2019年2月25日
逆强化学习-学习人先验的动机
CreateAMind
16+阅读 · 2019年1月18日
【NIPS2018】接收论文列表
专知
5+阅读 · 2018年9月10日
【SIGIR2018】五篇对抗训练文章
专知
12+阅读 · 2018年7月9日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
【学习】(Python)SVM数据分类
机器学习研究会
6+阅读 · 2017年10月15日
【推荐】决策树/随机森林深入解析
机器学习研究会
5+阅读 · 2017年9月21日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
相关论文
Arxiv
0+阅读 · 2021年10月18日
Arxiv
0+阅读 · 2021年10月15日
Arxiv
0+阅读 · 2021年10月14日
Arxiv
0+阅读 · 2021年7月7日
Type-augmented Relation Prediction in Knowledge Graphs
Arxiv
4+阅读 · 2018年1月15日
Top
微信扫码咨询专知VIP会员