【伯克利Roshan Rao博士论文】训练，评估和理解蛋白质序列的进化模型，Training, Evaluating, and Understanding Evolutionary Models for Protein Sequences - 专知VIP

会员服务 ·

7

蛋白质 · 蛋白质语言模型 · 博士论文 · 加州大学伯克利分校 (UC Berkeley) ·

2022 年 3 月 6 日

【伯克利Roshan Rao博士论文】训练，评估和理解蛋白质序列的进化模型，Training, Evaluating, and Understanding Evolutionary Models for Protein Sequences

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

新的蛋白质序列通过突变产生。这些突变可能是有害的，有益的，或中性的;突变对生物体进化适应性的影响反映在生物体存活的时间是否足够长，使其蛋白质能够被采样并储存在序列数据库中。长期以来，生物信息学一直寻求利用这种进化信号，通常以多重序列比对(MSAs)的形式，来推断新蛋白质的结构和功能。随着神经网络和自监督预训练的出现，一种不同的方法出现了，使用语言建模目标对大规模神经网络进行预训练，从输入的蛋白质序列自动生成信息特征。

本文介绍了在一个通用基准上训练和评估蛋白质语言模型的方法。随后，研究了增加模型缩放、数据集预处理和超参数训练对transformers 在没有监督的情况下学习蛋白质接触能力的影响。一种新的方法操作在MSAs而不是单一序列，然后提出，并显示在几个下游任务达到最先进的性能。最后，讨论了这些方法在蛋白质设计中的应用。

成为VIP会员查看完整内容

17

相关内容

蛋白质

蛋白质语言建模？伯克利RoshanRao157页博士论文《训练，评估和理解蛋白质序列的进化模型》

蛋白质语言建模？伯克利RoshanRao157页博士论文《训练，评估和理解蛋白质序列的进化模型》

专知会员服务

26+阅读 · 2022年3月22日

【哈佛大学】使用AlphaFold估算蛋白质模型精度的最新技术，State-of-the-Art Estimation of Protein Model Accuracy using AlphaFold

【哈佛大学】使用AlphaFold估算蛋白质模型精度的最新技术，State-of-the-Art Estimation of Protein Model Accuracy using AlphaFold

专知会员服务

21+阅读 · 2022年3月14日

【ICML2021】蛋白质语言模型-MSA Transformer

专知会员服务

34+阅读 · 2021年8月16日

【CMU博士论文】用动态超参数优化改进深度学习训练和推理，Improving Deep Learning Training and Inference with Dynamic Hyperparameter Optimization

【CMU博士论文】用动态超参数优化改进深度学习训练和推理，Improving Deep Learning Training and Inference with Dynamic Hyperparameter Optimization

专知会员服务

55+阅读 · 2020年5月26日

【微软】大型神经语言模型的对抗性训练，Adversarial Training for Large Neural Language Models

【微软】大型神经语言模型的对抗性训练，Adversarial Training for Large Neural Language Models

专知会员服务

51+阅读 · 2020年5月3日

蛋白质语言建模？伯克利RoshanRao157页博士论文《训练，评估和理解蛋白质序列的进化模型》

蛋白质语言建模？伯克利RoshanRao157页博士论文《训练，评估和理解蛋白质序列的进化模型》

专知

1+阅读 · 2022年3月22日

伯克利Roshan Rao 157页博士论文：训练，评估和理解蛋白质序列的进化模型

伯克利Roshan Rao 157页博士论文：训练，评估和理解蛋白质序列的进化模型

GenomicAI

1+阅读 · 2022年3月13日

深度学习预测蛋白质-蛋白质相互作用

深度学习预测蛋白质-蛋白质相互作用

机器之心

5+阅读 · 2022年1月15日

基于分子进化的蛋白质共进化高维互信息模型

国家自然科学基金

4+阅读 · 2015年12月31日

家蚕基因组中未知转座子的注释及比较基因组学研究

国家自然科学基金

0+阅读 · 2014年12月31日

参数复杂性、SAT求解器和树宽度

国家自然科学基金

0+阅读 · 2012年12月31日

自相互作用蛋白质的系统研究和预测

国家自然科学基金

2+阅读 · 2012年12月31日

改造调控蛋白设计D-塔格糖信号分子及其功能验证

国家自然科学基金

0+阅读 · 2011年12月31日

Blockwise Streaming Transformer for Spoken Language Understanding and Simultaneous Speech Translation

Blockwise Streaming Transformer for Spoken Language Understanding and Simultaneous Speech Translation

Arxiv

0+阅读 · 2022年4月19日

Characterizing and Understanding Distributed GNN Training on GPUs

Arxiv

1+阅读 · 2022年4月18日

Nonlinear Reduced DNN Models for State Estimation

Arxiv

0+阅读 · 2022年4月16日

XLNet: Generalized Autoregressive Pretraining for Language Understanding

Arxiv

14+阅读 · 2019年6月19日

Multilingual Sentiment Analysis: An RNN-Based Framework for Limited Data

Arxiv

12+阅读 · 2018年6月8日

VIP会员

相关主题

蛋白质语言模型

加州大学伯克利分校 (UC Berkeley)

相关VIP内容

蛋白质语言建模？伯克利RoshanRao157页博士论文《训练，评估和理解蛋白质序列的进化模型》

蛋白质语言建模？伯克利RoshanRao157页博士论文《训练，评估和理解蛋白质序列的进化模型》

专知会员服务

26+阅读 · 2022年3月22日

【哈佛大学】使用AlphaFold估算蛋白质模型精度的最新技术，State-of-the-Art Estimation of Protein Model Accuracy using AlphaFold

【哈佛大学】使用AlphaFold估算蛋白质模型精度的最新技术，State-of-the-Art Estimation of Protein Model Accuracy using AlphaFold

专知会员服务

21+阅读 · 2022年3月14日

【ICML2021】蛋白质语言模型-MSA Transformer

专知会员服务

34+阅读 · 2021年8月16日

【CMU博士论文】用动态超参数优化改进深度学习训练和推理，Improving Deep Learning Training and Inference with Dynamic Hyperparameter Optimization

【CMU博士论文】用动态超参数优化改进深度学习训练和推理，Improving Deep Learning Training and Inference with Dynamic Hyperparameter Optimization

专知会员服务

55+阅读 · 2020年5月26日

【微软】大型神经语言模型的对抗性训练，Adversarial Training for Large Neural Language Models

【微软】大型神经语言模型的对抗性训练，Adversarial Training for Large Neural Language Models

专知会员服务

51+阅读 · 2020年5月3日

热门VIP内容

开通专知VIP会员享更多权益服务

从代码基础模型到智能体与应用：代码智能的全面综述与实践指南

《北约认知战概念报告》

【MIT博士论文】高效的视觉合成生成模型

美海军放弃星座级转而采用国家安全巡逻舰设计

相关资讯

蛋白质语言建模？伯克利RoshanRao157页博士论文《训练，评估和理解蛋白质序列的进化模型》

蛋白质语言建模？伯克利RoshanRao157页博士论文《训练，评估和理解蛋白质序列的进化模型》

专知

1+阅读 · 2022年3月22日

伯克利Roshan Rao 157页博士论文：训练，评估和理解蛋白质序列的进化模型

伯克利Roshan Rao 157页博士论文：训练，评估和理解蛋白质序列的进化模型

GenomicAI

1+阅读 · 2022年3月13日

深度学习预测蛋白质-蛋白质相互作用

深度学习预测蛋白质-蛋白质相互作用

机器之心

5+阅读 · 2022年1月15日

相关基金

基于分子进化的蛋白质共进化高维互信息模型

国家自然科学基金

4+阅读 · 2015年12月31日

家蚕基因组中未知转座子的注释及比较基因组学研究

国家自然科学基金

0+阅读 · 2014年12月31日

参数复杂性、SAT求解器和树宽度

国家自然科学基金

0+阅读 · 2012年12月31日

自相互作用蛋白质的系统研究和预测

国家自然科学基金

2+阅读 · 2012年12月31日

改造调控蛋白设计D-塔格糖信号分子及其功能验证

国家自然科学基金

0+阅读 · 2011年12月31日

相关论文

Blockwise Streaming Transformer for Spoken Language Understanding and Simultaneous Speech Translation

Blockwise Streaming Transformer for Spoken Language Understanding and Simultaneous Speech Translation

Arxiv

0+阅读 · 2022年4月19日

Characterizing and Understanding Distributed GNN Training on GPUs

Arxiv

1+阅读 · 2022年4月18日

Nonlinear Reduced DNN Models for State Estimation

Arxiv

0+阅读 · 2022年4月16日

XLNet: Generalized Autoregressive Pretraining for Language Understanding

Arxiv

14+阅读 · 2019年6月19日

Multilingual Sentiment Analysis: An RNN-Based Framework for Limited Data

Arxiv

12+阅读 · 2018年6月8日

微信扫码咨询专知VIP会员