今日 Paper | 点云分类框架；多模式Transformer；神经网络；有序神经元等

会员服务 ·

今日 Paper | 点云分类框架；多模式Transformer；神经网络；有序神经元等

2020 年 3 月 5 日 AI科技评论

用于行人重识别的三元组在线实例匹配丢失

论文名称：Triplet Online Instance Matching Loss for Person Re-identification

作者：Li Ye /Yin Guangqiang /Liu Chunhui /Yang Xiaoyu /Wang Zhiguo

发表时间：2020/2/24

论文链接：https://arxiv.org/abs/2002.10560

推荐原因

这篇论文要解决的是行人重识别问题。

在线实例匹配（OIM）损失函数和三元组（Triplet）损失函数是行人重识别问题的主要方法。但这两个损失函数都有缺点，OIM损失对所有样本均等对待，没有关注困难样本，三重损失以复杂且繁琐的方式来处理批处理样本，因此收敛速度很缓慢。针对这些问题，这篇论文提出了三元组在线实例匹配（TOIM）损失函数，该函数能着重于困难样本并能有效地提高行人重识别模型的准确性。TOIM结合了OIM损失和Triplet损失的优点，并简化了批处理过程，从而使收敛更快。

用于DSTC8 AVSD挑战的带指针网络的多模式Transformer

论文名称：Multimodal Transformer with Pointer Network for the DSTC8 AVSD Challenge

作者：Le Hung /Chen Nancy F.

发表时间：2020/2/25

论文链接：https://arxiv.org/abs/2002.10695

推荐原因

这篇论文要解决的是视听场景感知对话（Audio-Visual Scene-Aware Dialog，AVSD）问题。

视听场景感知对话要求对话代理生成自然语言响应以解决用户查询并进行对话。这是一项具有挑战的任务，因为其包含多模态视频功能，例如包括文本、视觉和音频特征。对话代理还需要学习用户话语和系统响应之间的语义依赖，以便与人类进行连贯对话。这篇论文介绍该团队向第八届对话系统技术挑战赛（Dialogue System Technology Challenge）提交的AVSD参赛作品，采用了点积方式来结合输入视频的文本和非文本特征，通过在每个生成步骤中采用指针网络指向来自多个源序列的Tokens，进一步增强对话代理的生成能力。

PointAugment：一种自动增强的点云分类框架

论文名称：PointAugment: an Auto-Augmentation Framework for Point Cloud Classification

作者：Li Ruihui /Li Xianzhi /Heng Pheng-Ann /Fu Chi-Wing

发表时间：2020/2/25

论文链接：https://arxiv.org/abs/2002.10876

推荐原因

这篇论文被CVPR 2020接收，要解决的是点云分类的问题。

这篇论文提出了一个名为PointAugment的点云分类框架，当训练分类网络时，该框架会自动优化和扩充点云样本以丰富数据多样性。与现有的2D图像自动增强方法不同，PointAugment具有样本感知功能，并采用对抗学习策略来共同优化增强器网络和分类网络，学习生成最适合分类器的增强样本。PointAugment根据形状分类器和点位移来构造可学习的点增强函数，并根据分类器的学习进度精心设计损失函数以采用增强样本。PointAugment在改善形状分类和检索中的有效性和鲁棒性得到了实验的验证。