借助NVIDIA GPU,这个由17名成员组成的小组从多个制药数据集中获得了AI新发现,进而加速药物研究。
一般来说,制药公司通常非常注重对数据的保密,合作对于他们而言可能会面临知识产权问题,并且失去竞争优势。
但是共享数据有极大好处:制药公司拥有的数据越多,其研究人员就越有能力快速识别并开发有前景的新药,这也进而提升了药物研究的成功率,也降低了治疗成本。
MELLODDY是一个新的药物研发联盟,希望能够兼顾数据共享和安全性。其项目负责人Hugo Ceulemans表示,将一种药物推向市场平均需要13年时间,花费近20亿美元。
该项目借助了基于云的NVIDIA GPU,以及一种名为联邦学习的分布式方法,在多家制药公司的数据的基础上训练AI模型,同时可以保护知识产权。
MELLODDY是机器学习账本编制的首字母缩略词,主要目的是药物研究。它汇集了17家合作伙伴:10家领先的制药公司,如安进、拜耳、葛兰素史克、杨森制药和诺华制药;两所欧洲顶尖大学——鲁汶大学和布达佩斯科技经济大学;四个开拓性初创公司;以及NVIDIAAI计算平台。
每个合作伙伴都将使用自己的位于AWS之上的NVIDIA V100 Tensor 核心 GPU集群。MELLODDY的研究人员将会创建一个分布式深度学习模型,用于在不同的云集群中的传输以及对前所未有的1000万化合物注释数据的训练工作。
单个制药公司可以对AI数据进行调整,让它们契合特有的研究领域。作为MELLODDY数据安全任务的一部分,每个组织都将对其研究项目保密。
强森制药的Discovery Data Sciences项目科学总监Ceulemans说:“我们期待虚拟化药物研究能为患者带来更有效、更安全的治疗方案。机器学习和数据科学对每个行业来说都至关重要。”
展示前沿技术:联邦学习
MELLODDY致力于展示联邦学习技术如何为制药合作伙伴带来两全其美的好处:在不牺牲数据隐私的情况下,利用全球最大的协作药物复合数据集进行AI培训。
这一耗资2000万美元的项目将持续三年,届时MELLODDY将与公众分享经验。
联邦学习是一种分散的机器学习方法。在该方法中,训练数据不必汇集到一个聚合服务器中。相反,机器学习模型从存储在不同位置的数据中学习,从而确保每个制药公司的私有数据处在自己的安全基础架构中。
初创公司Owkin参与开发了MELLODDY联邦学习系统,其项目协调员 Mathieu Galtier表示:“这些数据非常安全。数据始终位于它自己的GPU服务器上,移动的是算法。”
药物数据集包含关于不同化合物及其属性的历史信息。
使用通用的MELLODDY联邦学习模型,每个合作伙伴将能够创建关于特定药物化合物的匿名查询。查询将发送到企业组织的任一数据存储库中,以识别任何潜在的匹配。
MELLODDY还将采用区块链分类系统,这样制药合作伙伴就可以维持对其数据集使用的可见性。
该联盟旨在提高基于AI的药物研究的预测性能,使制药公司能够在不向传统竞争对手提供直接访问专有数据集的情况下,相互学习对方的研究。随着智能模型的出现,药物开发将会变得速度更快、成本更低。