和许多计算机视觉任务一样,卷积神经网络在手写汉字识别上也取得了不错的成果。但是在可用数据很少的情况下,学习特殊特征进行图片识别是很难的任务。在这篇论文中,我们提出了一种学习连接神经网络的新方法,它用一种特殊架构预测手写汉字之间的相似性。经过优化的连接神经网络可以看作是简单的二元分类问题,完成训练后,特殊的特征可以帮助我们生成预测能力,不仅可以在新数据上产生效果,在完全陌生的类别上也能表现良好。
地址:https://arxiv.org/abs/1811.06347
深度卷积神经网络的不同图层可以编写进不同水平的信息。高层特征总是带有更多语义信息,而低层特征总是有更多细节信息。但是,低层特征通常会受到背景和语义模糊的干扰。在视觉识别领域,底层和高层的特征组合在语境调整中扮演着重要角色。但是,直接结合高层和低层的特征,细节信息的结合可能会造成背景噪声和语义模糊。所以在这篇论文中,我们提出了一种通用网络框架,用简单高效的方法连接不同图层中的CNN特征,这一框架成为选择性特征连接机制(SFCM)。
地址:https://arxiv.org/abs/1811.06295
语言中的结构性问答为用户提供了一种简便明了的方法,表达他们对多种任务所了解的信息。在这篇文章中,我们提出了一种方法直接根据文本数据回答问题,无需借助数据集中的结果。我们的方法结合了分布式问答和提取式问答模型。通过应用分布式问答,我们得以简化模型学习的问题。
地址:https://arxiv.org/abs/1811.06303