在过去的几年里,对于分子生物学中的每一个步骤,取得了显著的进展。虽然我们尚未完全将分子生物学转变为计算科学,或者将医学和人类健康变成一门工程学科,但目前的势头表明我们离这一愿景只有丰富的额外数据和一些进一步的发展。这种进展在某种程度上与人工智能应用的其他领域有所不同。就个人而言,我相信人工通用智能(AGI),即使是小型哺乳动物的水平,仍然在地平线之外。此外,组合学、离散算法和数学推理并不是LLM(大型语言模型)的强项。这是因为这些模型是前馈架构,不包括循环,除非通过将迄今生成的文本反馈给LLM作为输入而隐含地产生循环。正如Stephen Wolfram在他优秀的概述中所解释的,计算不可简化性保证了这些模型不能做某些事情(Wolfram 2023)。值得一提的是,这种能力的火花正在开始在GPT-4等系统中出现,正如Bubek等人在2023年所描述的那样。然而,对分子生物学的建模并不需要AGI:它不需要高层次的规划、主动性或目标,而且仅对组合学和算法推理有有限的需求。相反,对分子生物学的建模需要LLM在以下方面表现出色:学习复杂、嘈杂的序列数据的统计特性,以最佳方式从有损表示中预测这些数据。为了阐明这一观点,让我们来看一下在分子生物学中的中心法则的几个不同阶段近期的深度学习突破。

成为VIP会员查看完整内容
44

相关内容

大模型是基于海量多源数据打造的预训练模型,是对原有算法模型的技术升级和产品迭代,用户可通过开源或开放API/工具等形式进行模型零样本/小样本数据学习,以实现更优的识别、理解、决策、生成效果和更低成本的开发部署方案。
张潼新书《机器学习算法数学分析》,477页pdf
专知会员服务
202+阅读 · 2023年7月6日
【AAAI 2023教程】数据挖掘和机器学习的经济价值,203页ppt
【Jon Paul Janet】机器学习化学应用,153页ppt
专知会员服务
46+阅读 · 2021年12月5日
可信任机器学习,34页ppt
专知
5+阅读 · 2022年11月29日
《元强化学习》最新,70页ppt
专知
2+阅读 · 2022年9月16日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
Arxiv
164+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
425+阅读 · 2023年3月31日
Arxiv
71+阅读 · 2023年3月26日
Arxiv
154+阅读 · 2023年3月24日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员