Bayesian生物生产过程网络混合模型的政策优化 (Policy Optimization in Bayesian Network Hybrid Models of Biomanufacturing Processes) - 专知论文

会员服务 ·

0

贝叶斯网/贝叶斯网络 · Processing（编程语言） · 混合模型 · MoDELS · 优化器 ·

2021 年 5 月 13 日

Policy Optimization in Bayesian Network Hybrid Models of Biomanufacturing Processes

翻译：Bayesian生物生产过程网络混合模型的政策优化

Hua Zheng,Wei Xie,Ilya O. Ryzhov,Dongming Xie

from arxiv, 32 pages, 5 figures

Biopharmaceutical manufacturing is a rapidly growing industry with impact in virtually all branches of medicine. Biomanufacturing processes require close monitoring and control, in the presence of complex bioprocess dynamics with many interdependent factors, as well as extremely limited data due to the high cost and long duration of experiments. We develop a novel model-based reinforcement learning framework that can achieve human-level control in low-data environments. The model uses a probabilistic knowledge graph to capture causal interdependencies between factors in the underlying stochastic decision process, leveraging information from existing kinetic models from different unit operations while incorporating real-world experimental data. We then present a computationally efficient, provably convergent stochastic gradient method for policy optimization. Validation is conducted on a realistic application with a multi-dimensional, continuous state variable.

翻译：生物制药制造业是一个迅速增长的产业,对几乎所有医学分支都有影响。生物制造过程需要密切监测和控制,同时需要复杂的生物工艺动态和许多相互依存因素,以及由于试验成本高、时间长而极有限的数据。我们开发了一个新型的基于模型的强化学习框架,可以在低数据环境中实现人类层面的控制。模型使用概率知识图来捕捉基本诊断决策过程中各种因素之间的因果关系,利用不同单位操作的现有动能模型的信息,同时纳入现实世界的实验数据。我们然后为政策优化提出一种计算高效的、可预见趋同的梯度方法。验证是在现实应用的基础上进行的,并有一个多维、连续的状态变量。

0

相关内容

贝叶斯网/贝叶斯网络

贝叶斯网/贝叶斯网络

【CVPR2021】GAN人脸预训练模型

【CVPR2021】GAN人脸预训练模型

专知会员服务

24+阅读 · 2021年4月10日

【CVPR2021】动态度量学习

【CVPR2021】动态度量学习

专知会员服务

40+阅读 · 2021年3月30日

【CIKM2020】神经逻辑推理，Neural Logic Reasoning

【CIKM2020】神经逻辑推理，Neural Logic Reasoning

专知会员服务

51+阅读 · 2020年8月25日

最新《贝叶斯深度学习》综述论文，35页pdf，A Survey on Bayesian Deep Learning

最新《贝叶斯深度学习》综述论文，35页pdf，A Survey on Bayesian Deep Learning

专知会员服务

209+阅读 · 2020年7月5日

可解释强化学习，Explainable Reinforcement Learning: A Survey

可解释强化学习，Explainable Reinforcement Learning: A Survey

专知会员服务

131+阅读 · 2020年5月14日

神经网络的拓扑结构，TOPOLOGY OF DEEP NEURAL NETWORKS

神经网络的拓扑结构，TOPOLOGY OF DEEP NEURAL NETWORKS

专知会员服务

35+阅读 · 2020年4月15日

【MIT-MLSys2020】神经网络剪枝的研究进展状态，Neural Network Pruning

【MIT-MLSys2020】神经网络剪枝的研究进展状态，Neural Network Pruning

专知会员服务

29+阅读 · 2020年3月10日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

【强化学习论文推荐集合】2019年必读的10篇TOP强化学习论文，My Top 10 Deep RL Papers of 2019

【强化学习论文推荐集合】2019年必读的10篇TOP强化学习论文，My Top 10 Deep RL Papers of 2019

专知会员服务

42+阅读 · 2020年1月15日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

49+阅读 · 2019年10月17日

计算机 | 入门级EI会议ICVRIS 2019诚邀稿件

计算机 | 入门级EI会议ICVRIS 2019诚邀稿件

Call4Papers

10+阅读 · 2019年6月24日

强化学习三篇论文避免遗忘等

强化学习三篇论文避免遗忘等

CreateAMind

20+阅读 · 2019年5月24日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

计算机 | CCF推荐期刊专刊信息5条

计算机 | CCF推荐期刊专刊信息5条

Call4Papers

3+阅读 · 2019年4月10日

计算机类 | LICS 2019等国际会议信息7条

计算机类 | LICS 2019等国际会议信息7条

Call4Papers

3+阅读 · 2018年12月17日

已删除

将门创投

5+阅读 · 2018年1月24日

计算机类 | 国际会议信息7条

计算机类 | 国际会议信息7条

Call4Papers

3+阅读 · 2017年11月17日

【计算机类】期刊专刊/国际会议截稿信息6条

【计算机类】期刊专刊/国际会议截稿信息6条

Call4Papers

3+阅读 · 2017年10月13日

强化学习族谱

强化学习族谱

CreateAMind

26+阅读 · 2017年8月2日

A Unified Off-Policy Evaluation Approach for General Value Function

A Unified Off-Policy Evaluation Approach for General Value Function

Arxiv

0+阅读 · 2021年7月6日

A Multi-Objective Approach for Sustainable Generative Audio Models

Arxiv

0+阅读 · 2021年7月6日

Bayesian Learning-Based Adaptive Control for Safety Critical Systems

Arxiv

0+阅读 · 2021年7月4日

Scale Mixtures of Neural Network Gaussian Processes

Arxiv

0+阅读 · 2021年7月3日

Network of Tensor Time Series

Arxiv

20+阅读 · 2021年2月28日

Neural Architecture Generator Optimization

Arxiv

6+阅读 · 2020年10月8日

Multimodal Deep Network Embedding with Integrated Structure and Attribute Information

Multimodal Deep Network Embedding with Integrated Structure and Attribute Information

Arxiv

4+阅读 · 2019年3月28日

Graph Neural Networks for Social Recommendation

Arxiv

10+阅读 · 2019年2月19日

Parameter Space Noise for Exploration

Arxiv

3+阅读 · 2018年1月31日

Attributed Social Network Embedding

Arxiv

3+阅读 · 2017年5月14日

VIP会员

文章信息

相关主题

贝叶斯网/贝叶斯网络

Processing（编程语言）

相关VIP内容

【CVPR2021】GAN人脸预训练模型

【CVPR2021】GAN人脸预训练模型

专知会员服务

24+阅读 · 2021年4月10日

【CVPR2021】动态度量学习

【CVPR2021】动态度量学习

专知会员服务

40+阅读 · 2021年3月30日

【CIKM2020】神经逻辑推理，Neural Logic Reasoning

【CIKM2020】神经逻辑推理，Neural Logic Reasoning

专知会员服务

51+阅读 · 2020年8月25日

最新《贝叶斯深度学习》综述论文，35页pdf，A Survey on Bayesian Deep Learning

最新《贝叶斯深度学习》综述论文，35页pdf，A Survey on Bayesian Deep Learning

专知会员服务

209+阅读 · 2020年7月5日

可解释强化学习，Explainable Reinforcement Learning: A Survey

可解释强化学习，Explainable Reinforcement Learning: A Survey

专知会员服务

131+阅读 · 2020年5月14日

神经网络的拓扑结构，TOPOLOGY OF DEEP NEURAL NETWORKS

神经网络的拓扑结构，TOPOLOGY OF DEEP NEURAL NETWORKS

专知会员服务

35+阅读 · 2020年4月15日

【MIT-MLSys2020】神经网络剪枝的研究进展状态，Neural Network Pruning

【MIT-MLSys2020】神经网络剪枝的研究进展状态，Neural Network Pruning

专知会员服务

29+阅读 · 2020年3月10日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

【强化学习论文推荐集合】2019年必读的10篇TOP强化学习论文，My Top 10 Deep RL Papers of 2019

【强化学习论文推荐集合】2019年必读的10篇TOP强化学习论文，My Top 10 Deep RL Papers of 2019

专知会员服务

42+阅读 · 2020年1月15日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

49+阅读 · 2019年10月17日

热门VIP内容

开通专知VIP会员享更多权益服务

人工智能治理的未来

模态感知的特征匹配：单一模态与跨模态技术的全面综述

无监督行人重识别研究综述

【牛津博士论文】面向神经影像应用的可扩展且可解释的空间模型

相关资讯

计算机 | 入门级EI会议ICVRIS 2019诚邀稿件

计算机 | 入门级EI会议ICVRIS 2019诚邀稿件

Call4Papers

10+阅读 · 2019年6月24日

强化学习三篇论文避免遗忘等

强化学习三篇论文避免遗忘等

CreateAMind

20+阅读 · 2019年5月24日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

计算机 | CCF推荐期刊专刊信息5条

计算机 | CCF推荐期刊专刊信息5条

Call4Papers

3+阅读 · 2019年4月10日

计算机类 | LICS 2019等国际会议信息7条

计算机类 | LICS 2019等国际会议信息7条

Call4Papers

3+阅读 · 2018年12月17日

已删除

将门创投

5+阅读 · 2018年1月24日

计算机类 | 国际会议信息7条

计算机类 | 国际会议信息7条

Call4Papers

3+阅读 · 2017年11月17日

【计算机类】期刊专刊/国际会议截稿信息6条

【计算机类】期刊专刊/国际会议截稿信息6条

Call4Papers

3+阅读 · 2017年10月13日

强化学习族谱

强化学习族谱

CreateAMind

26+阅读 · 2017年8月2日

相关论文

A Unified Off-Policy Evaluation Approach for General Value Function

A Unified Off-Policy Evaluation Approach for General Value Function

Arxiv

0+阅读 · 2021年7月6日

A Multi-Objective Approach for Sustainable Generative Audio Models

Arxiv

0+阅读 · 2021年7月6日

Bayesian Learning-Based Adaptive Control for Safety Critical Systems

Arxiv

0+阅读 · 2021年7月4日

Scale Mixtures of Neural Network Gaussian Processes

Arxiv

0+阅读 · 2021年7月3日

Network of Tensor Time Series

Arxiv

20+阅读 · 2021年2月28日

Neural Architecture Generator Optimization

Arxiv

6+阅读 · 2020年10月8日

Multimodal Deep Network Embedding with Integrated Structure and Attribute Information

Multimodal Deep Network Embedding with Integrated Structure and Attribute Information

Arxiv

4+阅读 · 2019年3月28日

Graph Neural Networks for Social Recommendation

Arxiv

10+阅读 · 2019年2月19日

Parameter Space Noise for Exploration

Arxiv

3+阅读 · 2018年1月31日

Attributed Social Network Embedding

Arxiv

3+阅读 · 2017年5月14日

微信扫码咨询专知VIP会员