We present a margin-free finite mixture model which allows us to simultaneously classify objects into known classes and to identify possible new object types using a set of continuous attributes. This application is motivated by the needs of identifying and possibly detecting new types of a particular kind of stars known as variable stars. We first suitably transform the physical attributes of the stars onto the simplex to achieve scale invariance while maintaining their dependence structure. This allows us to compare data collected by different sky surveys which can have different scales. The model hence combines a mixture of Dirichlet mixtures to represent the known classes with the semi-supervised classification strategy of Vatanen et al. (2012) for outlier detection. In line with previous work on semiparametric model-based clustering, the single Dirichlet distributions can be seen as providing the baseline pattern of the data. These are then combined to effectively model the complex distributions of the attributes for the different classes. The model is estimated using a hierarchical two-step procedure which combines a suitably adapted version of the Expectation-Maximization (EM) algorithm with Bayes' rule. We validate our model on a reliable sample of periodic variable stars available in the literature (Dubath et al., 2011) achieving an overall classification accuracy of 71.95%, a sensitivity of 86.11% and a specificity of 99.79% for new class detection.


翻译:我们提出一个无差值的有限混合模型,允许我们同时将对象分类为已知的类别,并使用一组连续属性确定可能的新对象类型。这种应用的动机是需要识别和可能探测被称为变星的某类特殊类型的恒星的新型。我们首先将恒星的物理属性适当转换到简单x,以达到比例差异,同时保持其依赖结构。这使我们能够比较不同天空测量所收集的数据,这些测量可以有不同尺度。因此,该模型将狄里赫莱特混合物混合在一起,以代表已知的类别,同时采用Vatanen 等人的半监督分类战略(2012年)来进行外部检测。根据以前关于半参数模型组群的工作,单一迪里赫莱的分布可以被视为提供数据的基线模式。然后将这些分布结合起来,以有效地模拟不同类别属性的复杂分布,同时使用分级两步程序进行估算,该程序将预期-马克化(EM)算法与Bayes规则结合起来。我们验证了我们关于精确度为99-95的周期恒星样本模型,在2011年的文献中实现86 %的全面精确度分类。

0
下载
关闭预览

相关内容

专知会员服务
116+阅读 · 2019年12月24日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
152+阅读 · 2019年10月12日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
分布式并行架构Ray介绍
CreateAMind
9+阅读 · 2019年8月9日
异常检测论文大列表:方法、应用、综述
专知
126+阅读 · 2019年7月15日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Arxiv
24+阅读 · 2020年3月11日
Deep Anomaly Detection with Outlier Exposure
Arxiv
17+阅读 · 2018年12月21日
Zero-Shot Object Detection
Arxiv
9+阅读 · 2018年7月27日
Arxiv
3+阅读 · 2018年2月24日
VIP会员
相关VIP内容
专知会员服务
116+阅读 · 2019年12月24日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
152+阅读 · 2019年10月12日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
相关资讯
分布式并行架构Ray介绍
CreateAMind
9+阅读 · 2019年8月9日
异常检测论文大列表:方法、应用、综述
专知
126+阅读 · 2019年7月15日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员