【MIT博士论文】解开自然的复杂性:加速生命科学的机器学习，272页pdf - 专知VIP

会员服务 ·

25

麻省理工学院 (MIT) · 博士论文 · AI与生物学 · 机器学习 ·

2023 年 5 月 1 日

【MIT博士论文】解开自然的复杂性:加速生命科学的机器学习，272页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

生物过程的基本理解是现代医学和技术的主要支柱之一。生物机制是复杂的随机系统，尽管经过了几个世纪的严格科学研究，但我们对其仍知之甚少。近年来，机器学习（ML）已成为识别复杂数据集中感兴趣模式的强大框架。然而，在生命科学的广泛背景下，这类方法的影响仍然有限**。本研究旨在优化机器学习的实用性，加速基本生物问题的研究**。首先，我们提出从孤立的数据策划转向大规模多用途队列的范式转变，即使在人类实验最严格的情况下也是如此。通过Brain TreeBank（一种与颅内神经记录对齐的自然语言多模态数据集）揭示了这种方法的潜力。TreeBank提供了探测语言环境依赖性和大脑中表征的时空动态所需的分辨率和广度。其次，我们主张机器学习可解释性对加速生物学理解的重要性。我们开发了一种可解释的通用工具，用于在多个分辨率下建模离散随机过程并估计输出确定性。我们通过在整个癌症基因组中建模体细胞突变模式来展示该方法的实用性，并将其扩展到37种癌症的突变率图谱。该方法的置信区间和增加的敏感性确定了可能驱动编码和非编码区基因组癌症生长的突变集。总之，这项研究展示了计算方法如何克服生物数据中独特的挑战以及生物问题如何推动计算方法的发展。

成为VIP会员查看完整内容

35

相关内容

麻省理工学院 (MIT)

麻省理工学院 (MIT)

麻省理工学院（Massachusetts Institute of Technology，MIT）是美国一所研究型私立大学，位于马萨诸塞州（麻省）的剑桥市。麻省理工学院的自然及工程科学在世界上享有极佳的盛誉，该校的工程系曾连续七届获得美国工科研究生课程冠军，其中以电子工程专业名气最响，紧跟其后的是机械工程。其管理学、经济学、哲学、政治学、语言学也同样优秀。

【斯坦福博士论文】基础模型真实世界应用，178页pdf

【斯坦福博士论文】基础模型真实世界应用，178页pdf

专知会员服务

78+阅读 · 2023年6月15日

【普林斯顿博士论文】结构化生物医学数据的概率模型，130页pdf

【普林斯顿博士论文】结构化生物医学数据的概率模型，130页pdf

专知会员服务

24+阅读 · 2023年3月12日

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

专知会员服务

60+阅读 · 2022年9月7日

【斯坦福大学博士论文】用于临床试验和精准医疗的机器学习

【斯坦福大学博士论文】用于临床试验和精准医疗的机器学习

专知会员服务

44+阅读 · 2022年7月8日

【新书】多元统计与机器学习，185页pdf

【新书】多元统计与机器学习，185页pdf

专知会员服务

89+阅读 · 2022年6月5日

耶鲁大学最新博士论文《图先验、最优传输和深度学习在生物医学发现中的应用》231页pdf

耶鲁大学最新博士论文《图先验、最优传输和深度学习在生物医学发现中的应用》231页pdf

专知会员服务

54+阅读 · 2022年4月28日

【牛津大学】多级蒙特卡洛方法，70页pdf

【牛津大学】多级蒙特卡洛方法，70页pdf

专知会员服务

61+阅读 · 2022年2月3日

【斯坦福大学博士论文】现代机器学习优化问题：自适应、鲁棒性与隐私性

【斯坦福大学博士论文】现代机器学习优化问题：自适应、鲁棒性与隐私性

专知会员服务

71+阅读 · 2021年12月20日

【干货书】贝叶斯推理和机器学习，610页pdf

专知会员服务

259+阅读 · 2021年10月8日

自然语言处理现代方法，176页pdf

自然语言处理现代方法，176页pdf

专知会员服务

269+阅读 · 2021年2月22日

【阿姆斯特丹博士论文】GPU图算法性能分析与预测，227页pdf

【阿姆斯特丹博士论文】GPU图算法性能分析与预测，227页pdf

专知

8+阅读 · 2023年4月10日

【牛津大学博士论文】风险敏感且鲁棒的基于模型的强化学习与规划，201页pdf

【牛津大学博士论文】风险敏感且鲁棒的基于模型的强化学习与规划，201页pdf

专知

4+阅读 · 2023年4月7日

【2022新书】深度学习基因组学:生命科学和生物技术中基因组学应用的数据驱动方法，270页pdf

【2022新书】深度学习基因组学:生命科学和生物技术中基因组学应用的数据驱动方法，270页pdf

专知

8+阅读 · 2022年11月22日

【MIT博士论文】机器学习中的稀疏性:理论与应用，122页pdf

【MIT博士论文】机器学习中的稀疏性:理论与应用，122页pdf

专知

6+阅读 · 2022年11月21日

【2022新书】算法高维鲁棒统计，296页pdf与98页ppt

【2022新书】算法高维鲁棒统计，296页pdf与98页ppt

专知

4+阅读 · 2022年10月21日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

【MIT博士论文】自监督学习语音处理，148页pdf

【MIT博士论文】自监督学习语音处理，148页pdf

专知

8+阅读 · 2022年8月31日

【2022新书】人工智能自动医疗诊断的最新进展，371页pdf

【2022新书】人工智能自动医疗诊断的最新进展，371页pdf

专知

16+阅读 · 2022年8月16日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知

19+阅读 · 2022年7月11日

【斯坦福大学博士论文】用于临床试验和精准医疗的机器学习

【斯坦福大学博士论文】用于临床试验和精准医疗的机器学习

专知

5+阅读 · 2022年7月8日

相依回归模型与扩散过程的统计推断及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

食物致癌物杂环胺与蛋白质的加合物用作生物标记物的研究

国家自然科学基金

0+阅读 · 2013年12月31日

对微进化中遗传变异适应度的多群体联合估计：新方法及应用

国家自然科学基金

0+阅读 · 2013年12月31日

定量分析癌症基因组DNA甲基化模式复杂性及微进化特征

国家自然科学基金

0+阅读 · 2013年12月31日

金融连续时间随机过程的统计推断

国家自然科学基金

0+阅读 · 2012年12月31日

高维数据的图模型学习与统计推断

国家自然科学基金

8+阅读 · 2012年12月31日

新一代测序技术宏基因组数据分析的统计算法研究与应用

国家自然科学基金

0+阅读 · 2012年12月31日

统计推断理论和方法及其在生物医学、数据分析与计算等方面的应用

国家自然科学基金

1+阅读 · 2011年12月31日

高能太阳物理和天体物理中的粒子加速

国家自然科学基金

0+阅读 · 2011年12月31日

Q过程环境中的风险模型及Q矩阵的统计计算

国家自然科学基金

0+阅读 · 2011年12月31日

Particle simulation methods for the Landau-Fokker-Planck equation with uncertain data

Arxiv

0+阅读 · 2023年6月13日

A toy model provably featuring an arrow of time without past hypothesis

Arxiv

0+阅读 · 2023年6月12日

Towards Applying Powerful Large AI Models in Classroom Teaching: Opportunities, Challenges and Prospects

Arxiv

0+阅读 · 2023年6月12日

The Concept of Criticality in AI Safety

Arxiv

0+阅读 · 2023年6月12日

A Probabilistic Framework for Modular Continual Learning

Arxiv

0+阅读 · 2023年6月11日

Harnessing the Power of LLMs in Practice: A Survey on ChatGPT and Beyond

Arxiv

12+阅读 · 2023年4月26日

A Survey on Masked Autoencoder for Self-supervised Learning in Vision and Beyond

Arxiv

10+阅读 · 2022年7月30日

Causal Inference Principles for Reasoning about Commonsense Causality

Arxiv

13+阅读 · 2022年1月31日

An Introduction to Autoencoders

Arxiv

17+阅读 · 2022年1月11日

Causal Inference in Natural Language Processing: Estimation, Prediction, Interpretation and Beyond

Arxiv

21+阅读 · 2021年9月2日

VIP会员

相关主题

麻省理工学院 (MIT)

相关VIP内容

【斯坦福博士论文】基础模型真实世界应用，178页pdf

【斯坦福博士论文】基础模型真实世界应用，178页pdf

专知会员服务

78+阅读 · 2023年6月15日

【普林斯顿博士论文】结构化生物医学数据的概率模型，130页pdf

【普林斯顿博士论文】结构化生物医学数据的概率模型，130页pdf

专知会员服务

24+阅读 · 2023年3月12日

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

专知会员服务

60+阅读 · 2022年9月7日

【斯坦福大学博士论文】用于临床试验和精准医疗的机器学习

【斯坦福大学博士论文】用于临床试验和精准医疗的机器学习

专知会员服务

44+阅读 · 2022年7月8日

【新书】多元统计与机器学习，185页pdf

【新书】多元统计与机器学习，185页pdf

专知会员服务

89+阅读 · 2022年6月5日

耶鲁大学最新博士论文《图先验、最优传输和深度学习在生物医学发现中的应用》231页pdf

耶鲁大学最新博士论文《图先验、最优传输和深度学习在生物医学发现中的应用》231页pdf

专知会员服务

54+阅读 · 2022年4月28日

【牛津大学】多级蒙特卡洛方法，70页pdf

【牛津大学】多级蒙特卡洛方法，70页pdf

专知会员服务

61+阅读 · 2022年2月3日

【斯坦福大学博士论文】现代机器学习优化问题：自适应、鲁棒性与隐私性

【斯坦福大学博士论文】现代机器学习优化问题：自适应、鲁棒性与隐私性

专知会员服务

71+阅读 · 2021年12月20日

【干货书】贝叶斯推理和机器学习，610页pdf

专知会员服务

259+阅读 · 2021年10月8日

自然语言处理现代方法，176页pdf

自然语言处理现代方法，176页pdf

专知会员服务

269+阅读 · 2021年2月22日

热门VIP内容

开通专知VIP会员享更多权益服务

大语言模型智能体强化学习：全景综述

《城市滨海地区：理解复杂多变环境下的指挥控制框架》50页报告

【伯克利博士论文】从推理服务到训练：面向大规模 LLM 智能体的高效系统

美空军“顶点2025”实验：推进AI在C2、动态目标锁定与联盟集成中的应用

相关资讯

【阿姆斯特丹博士论文】GPU图算法性能分析与预测，227页pdf

【阿姆斯特丹博士论文】GPU图算法性能分析与预测，227页pdf

专知

8+阅读 · 2023年4月10日

【牛津大学博士论文】风险敏感且鲁棒的基于模型的强化学习与规划，201页pdf

【牛津大学博士论文】风险敏感且鲁棒的基于模型的强化学习与规划，201页pdf

专知

4+阅读 · 2023年4月7日

【2022新书】深度学习基因组学:生命科学和生物技术中基因组学应用的数据驱动方法，270页pdf

【2022新书】深度学习基因组学:生命科学和生物技术中基因组学应用的数据驱动方法，270页pdf

专知

8+阅读 · 2022年11月22日

【MIT博士论文】机器学习中的稀疏性:理论与应用，122页pdf

【MIT博士论文】机器学习中的稀疏性:理论与应用，122页pdf

专知

6+阅读 · 2022年11月21日

【2022新书】算法高维鲁棒统计，296页pdf与98页ppt

【2022新书】算法高维鲁棒统计，296页pdf与98页ppt

专知

4+阅读 · 2022年10月21日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

【MIT博士论文】自监督学习语音处理，148页pdf

【MIT博士论文】自监督学习语音处理，148页pdf

专知

8+阅读 · 2022年8月31日

【2022新书】人工智能自动医疗诊断的最新进展，371页pdf

【2022新书】人工智能自动医疗诊断的最新进展，371页pdf

专知

16+阅读 · 2022年8月16日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知

19+阅读 · 2022年7月11日

【斯坦福大学博士论文】用于临床试验和精准医疗的机器学习

【斯坦福大学博士论文】用于临床试验和精准医疗的机器学习

专知

5+阅读 · 2022年7月8日

相关基金

相依回归模型与扩散过程的统计推断及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

食物致癌物杂环胺与蛋白质的加合物用作生物标记物的研究

国家自然科学基金

0+阅读 · 2013年12月31日

对微进化中遗传变异适应度的多群体联合估计：新方法及应用

国家自然科学基金

0+阅读 · 2013年12月31日

定量分析癌症基因组DNA甲基化模式复杂性及微进化特征

国家自然科学基金

0+阅读 · 2013年12月31日

金融连续时间随机过程的统计推断

国家自然科学基金

0+阅读 · 2012年12月31日

高维数据的图模型学习与统计推断

国家自然科学基金

8+阅读 · 2012年12月31日

新一代测序技术宏基因组数据分析的统计算法研究与应用

国家自然科学基金

0+阅读 · 2012年12月31日

统计推断理论和方法及其在生物医学、数据分析与计算等方面的应用

国家自然科学基金

1+阅读 · 2011年12月31日

高能太阳物理和天体物理中的粒子加速

国家自然科学基金

0+阅读 · 2011年12月31日

Q过程环境中的风险模型及Q矩阵的统计计算

国家自然科学基金

0+阅读 · 2011年12月31日

相关论文

Particle simulation methods for the Landau-Fokker-Planck equation with uncertain data

Arxiv

0+阅读 · 2023年6月13日

A toy model provably featuring an arrow of time without past hypothesis

Arxiv

0+阅读 · 2023年6月12日

Towards Applying Powerful Large AI Models in Classroom Teaching: Opportunities, Challenges and Prospects

Arxiv

0+阅读 · 2023年6月12日

The Concept of Criticality in AI Safety

Arxiv

0+阅读 · 2023年6月12日

A Probabilistic Framework for Modular Continual Learning

Arxiv

0+阅读 · 2023年6月11日

Harnessing the Power of LLMs in Practice: A Survey on ChatGPT and Beyond

Arxiv

12+阅读 · 2023年4月26日

A Survey on Masked Autoencoder for Self-supervised Learning in Vision and Beyond

Arxiv

10+阅读 · 2022年7月30日

Causal Inference Principles for Reasoning about Commonsense Causality

Arxiv

13+阅读 · 2022年1月31日

An Introduction to Autoencoders

Arxiv

17+阅读 · 2022年1月11日

Causal Inference in Natural Language Processing: Estimation, Prediction, Interpretation and Beyond

Arxiv

21+阅读 · 2021年9月2日

微信扫码咨询专知VIP会员