Non-linear dimensionality reduction can be performed by \textit{manifold learning} approaches, such as Stochastic Neighbour Embedding (SNE), Locally Linear Embedding (LLE) and Isometric Feature Mapping (ISOMAP). These methods aim to produce two or three latent embeddings, primarily to visualise the data in intelligible representations. This manuscript proposes extensions of Student's t-distributed SNE (t-SNE), LLE and ISOMAP, for dimensionality reduction and visualisation of multi-view data. Multi-view data refers to multiple types of data generated from the same samples. The proposed multi-view approaches provide more comprehensible projections of the samples compared to the ones obtained by visualising each data-view separately. Commonly visualisation is used for identifying underlying patterns within the samples. By incorporating the obtained low-dimensional embeddings from the multi-view manifold approaches into the K-means clustering algorithm, it is shown that clusters of the samples are accurately identified. Through the analysis of real and synthetic data the proposed multi-SNE approach is found to have the best performance. We further illustrate the applicability of the multi-SNE approach for the analysis of multi-omics single-cell data, where the aim is to visualise and identify cell heterogeneity and cell types in biological tissues relevant to health and disease.


翻译:非线性维度的减少可以通过“Textit{manfoldlearning”方法进行,例如“Stochastestic neconnection nebedition” (SNE)、“局部线性嵌入” (LLLE) 和“Isoter Feature Conta” (ISOMA) 等方法进行。这些方法旨在产生两三个潜在的嵌入层,主要是为了以可理解的表示方式对数据进行可视化。本稿建议扩展“学生的T-SNE”(T-SNE)、LLE和ISOMAP”,用于多视图数据的维度减少和可视化。多视图数据是指从同一样本中产生的多种数据类型。提议的多视图方法提供了与通过对每个数据视图分别进行可视化而获得的样本相比更为易懂的样本预测。共同可视化用于确定样本中的基本模式。通过将获得的多视化的SNE(t-S)、多角度组合算算法,可以准确识别这些样本的组群集。通过对真实和合成数据进行分析,发现“多面-SNE” 和多面细胞分析,我们进一步说明他在生物细胞分析中找到的多目的的多角度分析。

0
下载
关闭预览

相关内容

流形学习,全称流形学习方法(Manifold Learning),自2000年在著名的科学杂志《Science》被首次提出以来,已成为信息科学领域的研究热点。在理论和应用上,流形学习方法都具有重要的研究意义。假设数据是均匀采样于一个高维欧氏空间中的低维流形,流形学习就是从高维采样数据中恢复低维流形结构,即找到高维空间中的低维流形,并求出相应的嵌入映射,以实现维数约简或者数据可视化。它是从观测到的现象中去寻找事物的本质,找到产生数据的内在规律。
【干货书】真实机器学习,264页pdf,Real-World Machine Learning
专知会员服务
158+阅读 · 2020年1月16日
机器学习入门的经验与建议
专知会员服务
89+阅读 · 2019年10月10日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
52+阅读 · 2019年9月29日
跟踪SLAM前沿动态系列之ICCV2019
泡泡机器人SLAM
7+阅读 · 2019年11月23日
计算机经典算法回顾与展望——机器学习与数据挖掘
中国计算机学会
5+阅读 · 2019年10月11日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
25+阅读 · 2019年5月18日
IEEE | DSC 2019诚邀稿件 (EI检索)
Call4Papers
10+阅读 · 2019年2月25日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
15+阅读 · 2018年12月24日
二值多视角聚类:Binary Multi-View Clustering
我爱读PAMI
4+阅读 · 2018年6月24日
Arxiv
0+阅读 · 2021年7月2日
Arxiv
11+阅读 · 2020年8月3日
3D Deep Learning on Medical Images: A Review
Arxiv
11+阅读 · 2020年4月1日
Arxiv
12+阅读 · 2019年3月14日
One-Shot Federated Learning
Arxiv
9+阅读 · 2019年3月5日
Arxiv
15+阅读 · 2018年6月23日
Arxiv
5+阅读 · 2018年5月31日
Arxiv
5+阅读 · 2017年7月25日
VIP会员
相关资讯
跟踪SLAM前沿动态系列之ICCV2019
泡泡机器人SLAM
7+阅读 · 2019年11月23日
计算机经典算法回顾与展望——机器学习与数据挖掘
中国计算机学会
5+阅读 · 2019年10月11日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
25+阅读 · 2019年5月18日
IEEE | DSC 2019诚邀稿件 (EI检索)
Call4Papers
10+阅读 · 2019年2月25日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
15+阅读 · 2018年12月24日
二值多视角聚类:Binary Multi-View Clustering
我爱读PAMI
4+阅读 · 2018年6月24日
相关论文
Arxiv
0+阅读 · 2021年7月2日
Arxiv
11+阅读 · 2020年8月3日
3D Deep Learning on Medical Images: A Review
Arxiv
11+阅读 · 2020年4月1日
Arxiv
12+阅读 · 2019年3月14日
One-Shot Federated Learning
Arxiv
9+阅读 · 2019年3月5日
Arxiv
15+阅读 · 2018年6月23日
Arxiv
5+阅读 · 2018年5月31日
Arxiv
5+阅读 · 2017年7月25日
Top
微信扫码咨询专知VIP会员