网络(或图表)在生物学和医学中无处不在,从分子相互作用图到人口规模的社会和健康相互作用。例如,分子结构可以分别从原子和键转换为节点和边;蛋白质相互作用自然形成了一个基于物理相互作用或功能关系存在的网络;网络可以由药物(例如,小化合物)、蛋白质和疾病组成,以便建模药物-药物相互作用、药物与靶蛋白的结合以及识别药物-疾病治疗机会;病人记录可以表示为网络,其中边缘可能表示医疗代码在健康记录中共同出现。
图表示学习,也被称为图上的机器学习,几何深度学习,或图神经网络(GNNs),已经成为网络数据集深度学习的领先范式。图的深度学习尤其具有挑战性,因为图包含复杂的地形结构,没有固定的节点排序,也没有参考点。图还可以包含许多不同类型的实体(节点)和相互关联的富交互(边)。经典的深度学习方法无法考虑如此多样的结构属性和丰富的交互,这是网络的本质,因为它们是为固定大小的网格(即图像和表格数据集)或序列(即文本)设计的。类似于图像和文本的深度学习如何彻底改变了图像分析和自然语言处理领域,图表示学习的进步使科学界能够更广泛地使用深度学习,不仅用于图像和文本数据集,而且用于任何相互连接的、联网的数据系统。这些算法的进步为深度学习在生物和医学领域的应用创造了新的前沿。此外,他们促进了生物和医学的科学创新,我们将在教程中介绍。因此,为了进一步刺激算法和科学创新,我们的教程旨在为广大科学受众提供关于生物医学中的图表示学习的综合和回顾。
目录内容:
Marinka Zitnik
图9:Marinka Zitnik
哈佛医学院助理教授,曾与Jure Leskovec合作,利用GCN图卷积网络预测海量药物相互作用,开发的Decagon系统可以帮助医生更好地决定开哪种药,以及帮助研究人员找到治疗复杂疾病的更好的药物组合。