论文名字
Effective Modeling of Encoder-Decoder Architecture for Joint Entity and Relation Extraction
论文摘要
贝叶斯神经网络(BNNs)通过对网络权值进行贝叶斯推理,将不确定性估计引入到深层网络中。然而,这样的模型带来了推理的挑战,而且具有权重不确定性的bnn很少能获得优于标准模型的性能。本文通过对深度神经网络结构进行贝叶斯推理,提出了一种新的贝叶斯深度学习方法。借鉴神经结构搜索的思想,将网络结构定义为计算节点间再邓顿运算的选通权值,并应用随机变量推理技术来学习网络的结构分布。从经验上看,该方法大大超过了先进的深层神经网络,完成了一系列的分类和分割任务。更重要的是,我们的ap方法还保留了贝叶斯原理的优点,比包括MC-dropout和variationalBNNs算法(如噪声EK-FAC)在内的强基线产生了改进的不确定性估计。
论文作者
邓志杰,罗玉岑,朱军军,张博博,来自于清华大学THBI实验室,BNRist中心理工学院 ,计算机科学与技术系,人工智能研究所,Intell国家重点实验室。