论文题目
基于卷积神经网络的基因组序列基序的表示学习,Representation learning of genomic sequence motifs with convolutional neural networks
论文简介
尽管卷积神经网络(CNNs)已经被应用于各种计算基因组学问题,但是在我们理解它们如何构建调控基因组序列的表达方面仍然存在很大的差距。在这里,我们对合成序列进行了系统的实验,以揭示CNN结构,特别是卷积滤波器大小和最大池,如何影响序列模体表示被第一层滤波器学习的程度。我们发现,设计用于培养序列模体的层次表示学习的CNNs在更深的层次将部分特征组装成整体特征倾向于学习分布式表示,即部分模体。另一方面,设计用于限制在较深层中分层构建序列基序表示的能力的CNNs倾向于学习更多可解释的局部表示,即整个基序。然后,我们验证了从合成序列建立的表示学习原理推广到体内序列。
论文作者
Peter K. Koo ,隶属美国马萨诸塞州剑桥哈佛大学分子与细胞生物学系霍华德休斯医学院。