来自谷歌的研究人员在“测量合成泛化:真实数据的综合方法”论文中,试图引入了最大和最全面的基准来解决这个问题。这个基准使用真实的自然语言理解任务,特别是语义解析和问题回答来进行合成泛化。

在具体的工作中,相关研究人员提出了复合散度(compound divergence)测量指标,这个指标可以量化训练-测试集的分离程度,以便测量机器学习的合成泛化能力。

研究人员分析了三种序列到序列机器学习体系结构的合成泛化能力,发现它们的泛化能力堪忧。在论文中,作者还发布了工作中使用的组合Freebase Questions数据集

成为VIP会员查看完整内容
19

相关内容

【ICLR 2019】双曲注意力网络,Hyperbolic  Attention Network
专知会员服务
82+阅读 · 2020年6月21日
【CVPR2020-北京大学】自适应间隔损失的提升小样本学习
专知会员服务
84+阅读 · 2020年6月9日
【ICML2020-哈佛】深度语言表示中可分流形
专知会员服务
12+阅读 · 2020年6月2日
【CVPR2020-Oral】用于深度网络的任务感知超参数
专知会员服务
26+阅读 · 2020年5月25日
图神经网络表达能力的研究综述,41页pdf
专知会员服务
169+阅读 · 2020年3月10日
Heterogeneous Graph Transformer
Arxiv
27+阅读 · 2020年3月3日
Arxiv
14+阅读 · 2019年11月26日
Bivariate Beta LSTM
Arxiv
5+阅读 · 2019年10月7日
Star-Transformer
Arxiv
5+阅读 · 2019年2月28日
The Evolved Transformer
Arxiv
5+阅读 · 2019年1月30日
Arxiv
11+阅读 · 2018年7月8日
Arxiv
4+阅读 · 2018年4月26日
VIP会员
相关主题
相关论文
Heterogeneous Graph Transformer
Arxiv
27+阅读 · 2020年3月3日
Arxiv
14+阅读 · 2019年11月26日
Bivariate Beta LSTM
Arxiv
5+阅读 · 2019年10月7日
Star-Transformer
Arxiv
5+阅读 · 2019年2月28日
The Evolved Transformer
Arxiv
5+阅读 · 2019年1月30日
Arxiv
11+阅读 · 2018年7月8日
Arxiv
4+阅读 · 2018年4月26日
微信扫码咨询专知VIP会员