在生物医学领域,DeepMind 又做出了具有里程碑意义的产品。
两年一度的国际蛋白质结构预测竞赛(CASP)的在周末正式公布最终结果。这个已经进行了 25 年的比赛项目,每届都有来自世界各地的数百支团队参与,以促进研究和衡量最新方法在提高预测准确性方面的进展。
据《卫报》报道,DeepMind 花了两年的时间做出来的“新生儿”AlphaFold 这次在 98 名参赛者中排名第一,它获得了预测 43 种蛋白中的 25 种蛋白结构的最高分,排名第二的队伍只有其中 3 个获得了预测最高分。CASP 的组织者称 DeepMind “用计算方法在预测蛋白结构中取得了前所未有的进步”。
实际上,早在 2017 年 10 月,DeepMind 就表示他们对人工智能在药物开发中的应用感兴趣,而新药开发的重要一步就是对靶点蛋白质三维结构的精准测算。
DeepMind 近日在博客中介绍了背后的技术原理。DeepMind 称,通过采用跨学科方法,DeepMind 汇集了来自结构生物学、物理学和机器学习领域的专家,使用前沿技术在仅基于基因序列的基础上预测蛋白质的 3D 结构。
▌蛋白折叠难题
众所周知,蛋白质是维持生命所必需的分子,带有蛋白质编码的 DNA 片段则称为基因,而蛋白质的功能一般取决于其独特的 3D 结构。
例如,构成人体免疫系统的抗体蛋白是“Y 形”的,形状类似于独特的钩。通过锁定病毒和细菌,抗体蛋白能够检测和标记这些引发疾病的微生物并最终消灭它们。其他类型的蛋白质包括 CRISPR 和 Cas9,它们会像剪刀一样剪切并粘贴 DNA。
但纯粹从蛋白质的基因序列中找出三维形状并不容易,其挑战在于 DNA 仅包含有关蛋白质构建块序列的信息——氨基酸残基,它形成了长链,预测这些链如何折叠成蛋白质的复杂 3D 结构也就是所谓的“蛋白折叠问题”,是科学家们几十年来都未曾解决的难题。
而预测蛋白质的形状有助于科学家了解它在体内的作用,这也是诊断和治疗由错误折叠的蛋白质所引发疾病的基础,如阿尔茨海默氏症、帕金森氏症、亨丁頓氏舞蹈症和囊肿性纤维化。
随着科学家们通过模拟和模型获得更多关于蛋白质形状及其运作方式的知识,它会在药物发现中发挥作用,同时也能降低相关实验成本,这将造福全世界数百万患者。此外,对蛋白折叠的理解也将有助于生物可降解酶的发展,以此更容易分解废物。
▌AI 能做什么?
在过去的五十年中,科学家们已经能够使用冷冻电子显微镜、核磁共振等技术来确定实验室中的蛋白质形状,但这些方法的成本高达成千上万美元,而人工智能方法恰是很好的替代方案。
过去几年中,由于基因测序成本的快速降低以及基因组学领域丰富的大数据,依赖于基因组数据预测问题的深度学习方法变得越来越流行。
DeepMind 的团队专注于从头开始建模目标形状的难题,而不是使用先前解析的蛋白质作为模板。总体而言,他们使用了两种不同的方法来预测完整的蛋白质结构。
使用神经网络预测物理特性
这两种方法都依赖于深度神经网络,这些神经网络经过训练可以从基因序列中预测蛋白质的特性。
他们的神经网络预测的特性包括:(a)氨基酸对之间的距离和(b)连接这些氨基酸的化学键之间的角度。这是在常用技术基础上的一大进步,这些技术估计氨基酸对是否彼此接近。
他们训练了一个神经网络来预测蛋白质中每对残基之间的距离分布,然后将这些概率组合成评估蛋白质结构准确度的分数。他们还训练了一个单独的神经网络,该网络使用汇总了的所有距离分布来评估预测结构与标准结构的接近程度。
构建蛋白结构预测的新方法
使用这些评分函数,能够找到与他们的预测相匹配的结构。他们的第一种方法建立在结构生物学常用的技术上,并用新的蛋白质片段反复替换蛋白质结构的片段。他们训练出了一种生成神经网络来构建新片段,以此来不断提升预测蛋白质结构的准确度。
第二种方法是通过梯度下降方法来优化准确度,这种技术应用在了整个蛋白链而不是在组合之前单独折叠的片段中,这也降低了预测处理的复杂性。
“预测蛋白折叠形状对解决很多世纪性难题有重要意义。它可以影响健康、生态、环境等任何涉及生命系统的问题。”在表达了对人工智能的信心后,雷丁大学的研究人员 Liam McGuffin 也理性表示,蛋白折叠问题目前只是迈出了第一步,这是一个极具挑战性的问题,还有很多好想法没能实施。
尽管 AlphaFold 没有像“大哥”AlphaGo 横空出世时那样的热度,但这并不能忽视 AlphaFold 对业界所具有的重要意义。
在 DeepMind 团队看来,AlphaFold 的初步成就表明了 AI 在科学发现中的实用性,机器学习系统能整合各种信息来源,以帮助科学家快速找到解决复杂问题的创造性解决方案。正如我们已经看到 AI 如何通过 AlphaGo 和 AlphaZero 等系统帮助人们掌握复杂游戏。他们希望,AI 技术的突破有一天会帮助人类掌握基本的科学问题。
近来在 AI 在生物医学领域的应用,包括语音录入病历、医疗影像、健康管理等多领域已然取得了一些成绩,但总体而言任重道远,我们需要更多像 DeepMind 这样的团队不断地进行探索。
参考链接:https://deepmind.com/blog/alphafold/
本文为 AI科技大本营整理文章,转载请联系微信 1092722531。
【完】
New 菜单升级啦,一键直通CSDN会员服务。你关心的开发问题,这里都有答案!
搜索:开发疑难/资源一键查找,搜遍CSDN全站
会员购买:专属VIP购买,免积分下载/免广告/获免费课程
下载APP:安装CSDN APP,CSDN资源随身带
个人中心:掌上CSDN个人助手,专属您的个人空间
2018 中国大数据技术大会
◆
BDTC 2018
◆
BDTC 2018中国大数据技术大会携主题“大数据新应用”再度强势来袭。本次大会由华东师范大学副校长、教授周傲英,百度商业智能实验室主任熊辉,阿里巴巴副总裁李飞飞三位会议主席对大会内容把关,多位两院院士参与指导,由最了解行业痛点的一线从业者为同行打造。
扫描下方二维码或点击【阅读原文】快速购票。现在购票还有机会获得大数据图书一本(中国科学院院士梅宏主编的《大数据导论》或华中科技大学教授金海主编的《大数据处理》),数量有限!
推荐阅读