Non-negative Matrix Factorization (NMF) is a useful method to extract features from multivariate data, but an important and sometimes neglected concern is that NMF can result in non-unique solutions. Often, there exist a Set of Feasible Solutions (SFS), which makes it more difficult to interpret the factorization. This problem is especially ignored in cancer genomics, where NMF is used to infer information about the mutational processes present in the evolution of cancer. In this paper the extent of non-uniqueness is investigated for two mutational counts data, and a new sampling algorithm, that can find the SFS, is introduced. Our sampling algorithm is easy to implement and applies to an arbitrary rank of NMF. This is in contrast to state of the art, where the NMF rank must be smaller than or equal to four. For lower ranks we show that our algorithm performs similarly to the polygon inflation algorithm that is developed in relations to chemometrics. Furthermore, we show how the size of the SFS can have a high influence on the appearing variability of a solution. Our sampling algorithm is implemented in an R package \textbf{SFS} (\url{https://github.com/ragnhildlaursen/SFS}).


翻译:非负矩阵系数(NMF)是从多种变异数据中提取特征的有用方法,但一个重要的、有时被忽视的担心是NMF可以产生非独特的解决方案。通常,存在一套可行的解决方案(SFS),这使得解释系数化更加困难。这个问题在癌症基因组学中尤其被忽视,因为NMF用来推断有关癌症进化过程中的突变过程的信息。在本文中,调查非异化的程度是为了两种突变计数据和可以找到 SFS 的新的抽样算法。我们的抽样算法很容易执行并适用于任意的NMF等级。这与艺术状态不同,因为NMF的等级必须小于或等于4。对于较低等级,我们显示我们的算法表现与在色度学关系中发展的多边通货膨胀算法相类似。此外,我们展示SFSFS的大小如何对解决办法的变异性产生很大影响。我们的取样算法在Ragirgirm/SFSFN{SF{Smb}(我们的抽样算法在Ragragiral/SFSFrr/Smb{S{Smb{Smb{S}中实施)。

0
下载
关闭预览

相关内容

【干货书】机器学习速查手册,135页pdf
专知会员服务
122+阅读 · 2020年11月20日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
76+阅读 · 2020年7月26日
强化学习最新教程,17页pdf
专知会员服务
168+阅读 · 2019年10月11日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
99+阅读 · 2019年10月9日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
已删除
生物探索
3+阅读 · 2018年2月10日
Adversarial Variational Bayes: Unifying VAE and GAN 代码
CreateAMind
7+阅读 · 2017年10月4日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Arxiv
0+阅读 · 2021年3月15日
Arxiv
0+阅读 · 2021年3月12日
Arxiv
3+阅读 · 2018年10月18日
Arxiv
3+阅读 · 2018年2月24日
VIP会员
相关资讯
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
已删除
生物探索
3+阅读 · 2018年2月10日
Adversarial Variational Bayes: Unifying VAE and GAN 代码
CreateAMind
7+阅读 · 2017年10月4日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员