清华孙茂松等自然·通讯杂志发表生物医学知识计算研究《深度学习系统桥接分子结构和生物医学文本,具有与人类专业相当的理解力》

2022 年 2 月 23 日 专知

近日,计算机系孙茂松团队成功研制了能够综合阅读生物医学领域文献和分子结构的深度学习技术,相关研究成果“连通分子结构与生医文献的深度学习系统”(A Deep-learning System Bridging Molecule Structure and Biomedical Text with Comprehension Comparable to Human Professionals)于2月14日在《自然·通讯》(NatureCommunications)上在线发表。


对分子实体的性质及其相互作用规律的深度理解是药物研发的重要基础,长久以来受到生物医学领域研究者的广泛关注,研究成果分布在海量科研文献中。为了加快生物医学研究进程,深度学习技术被应用于阅读和处理大规模生物医学数据,以自动提取分子实体的相关知识。然而现有面向生医文献和分子结构信息的机器阅读技术只能孤立地处理特定类型信息,无法同时处理文本和分子结构等多种类型信息,难以提取和整合蕴藏其间的复杂知识,这与人类专家相比存在较大差距。为了解决这一挑战问题,孙茂松团队提出采用统一的深度学习框架连通分子结构和生医文献,建立富知识的机器阅读模型,实现对分子实体的全面深度理解,更好地协助生物医学研究。多项实验结果表明,该技术具有对分子结构和生物医学文献等信息的综合处理能力,特别是在分子性质理解测试任务上,该模型可以达到与人类专家相当的性能。

孙茂松团队所提出的连通分子结构和生医文献的深度学习模型,已在多个生物医学典型研究场景中验证了有效性,并进一步实现了深度学习技术辅助生物医学研究的新范式。例如对于任意分子结构,该模型可以预测并生成该分子性质的自然语言描述;对于给定的分子性质要求,该模型可以协助筛选符合条件的分子结构等。该研究展示了深度学习技术在阅读理解海量生医文献和知识库、促进自动药物发现和性质理解方面的巨大潜力。

分子结构与生医文献的协同学习框架

该论文通讯作者为计算机系党委副书记刘知远副教授与孙茂松教授,第一作者为计算机系博士生曾哲妮与姚远。该研究由国家重点研发计划与清华大学国强研究院提供支持。原文链接:https://www.nature.com/articles/s41467-022-28494-3

专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“DLBT” 就可以获取清华孙茂松等自然·通讯杂志发表生物医学知识计算研究《深度学习系统桥接分子结构和生物医学文本,具有与人类专业相当的理解力》》专知下载链接

专知,专业可信的人工智能知识分发 ,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取70000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取70000+AI主题知识资源
登录查看更多
1

相关内容

孙茂松,教授,博士生导师,曾任清华大学计算机科学与技术系系主任,现任教育部在线教育研究中心副主任、清华大学计算机系党委书记、清华大学大规模在线开放教育研究中心主任。国家重点基础研究发展计划项目首席科学家、国家社会科学基金重大项目首席专家、教育部在线教育研究中心副主任、教育部教学信息化与教学方法创新指导委员会副主任委员、清华大学大规模在线教育研究中心主任、清华大学-新加坡国立大学下一代搜索技术联合研究中心共同主任。研究领域包括自然语言处理、人工智能、机器学习、社会计算和计算教育学。个人主页:http://nlp.csai.tsinghua.edu.cn/site2/index.php/zh/people?id=16
专知会员服务
28+阅读 · 2021年8月27日
领域应用 | 中医临床知识图谱的构建与应用
开放知识图谱
33+阅读 · 2017年12月12日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
6+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Arxiv
0+阅读 · 2022年4月20日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
6+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员