【ICML2020-哈佛】深度语言表示中可分流形 - 专知VIP

会员服务 ·

2

深度语言表示 · 可分流形 ·

2020 年 6 月 2 日

【ICML2020-哈佛】深度语言表示中可分流形

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

人工神经网络(ANNS)在解决各种认知模式下的感知任务方面显示出很大的经验成功。虽然它们只是受到生物大脑的松散启发，但最近的研究报告称，从任务优化的神经网络中提取的表征与大脑中的神经种群之间存在相当多的相似性。神经网络后来成为一个流行的模型类，用来推断复杂认知功能下的计算原理，反过来，它们也成为一个自然的实验平台，用来应用最初开发的方法来探测神经群体中的信息。在这项工作中，我们利用平均场理论流形分析，从计算神经科学的最新技术，从大规模语境嵌入模型分析语言表示的高维几何。我们从不同的模型族(BERT, RoBERTa, GPT-2等)中探索表征，并找到跨层深度的语言流形出现的证据(例如词性流形和组合范畴语法标签)。我们进一步观察到，不同的编码方案用于获取表示，导致这些语言流形出现在网络的早期或后期层的差异。此外，我们发现这些流形中线性可分性的出现是由流形半径、维数和流形间相关性的联合减少所驱动的。

https://arxiv.org/abs/2006.01095

成为VIP会员查看完整内容

13

相关内容

深度语言表示

深度语言表示

【ICML2020】深度神经网络置信感知学习，Conﬁdence-Aware Learning for Deep Neural Networks

【ICML2020】深度神经网络置信感知学习，Conﬁdence-Aware Learning for Deep Neural Networks

专知会员服务

74+阅读 · 2020年7月6日

【ICML2020-上海交大】多智能体确定性Q-Learning， Multi-Agent Determinantal Q-Learning

【ICML2020-上海交大】多智能体确定性Q-Learning， Multi-Agent Determinantal Q-Learning

专知会员服务

38+阅读 · 2020年6月3日

【ICML2020】小样本目标检测

【ICML2020】小样本目标检测

专知会员服务

91+阅读 · 2020年6月2日

【哈佛大学】机器学习的黑盒解释性，52页ppt

【哈佛大学】机器学习的黑盒解释性，52页ppt

专知会员服务

172+阅读 · 2020年5月27日

【微软亚研】预训练文本表示作为元学习，Pre-training Text Representations

【微软亚研】预训练文本表示作为元学习，Pre-training Text Representations

专知会员服务

40+阅读 · 2020年4月17日

【微软-ACL2020】TinyMBERT: Multi-Stage Distillation Framework for Massive Multi-lingual NER

【微软-ACL2020】TinyMBERT: Multi-Stage Distillation Framework for Massive Multi-lingual NER

专知会员服务

36+阅读 · 2020年4月14日

【ACL2020-伯克利】预训练Transformer提高分布外鲁棒性

【ACL2020-伯克利】预训练Transformer提高分布外鲁棒性

专知会员服务

20+阅读 · 2020年4月14日

【ICML2020投稿论文-CMU-DeepMind-Google】用于评估跨语言泛化的大规模多语言多任务基准

【ICML2020投稿论文-CMU-DeepMind-Google】用于评估跨语言泛化的大规模多语言多任务基准

专知会员服务

14+阅读 · 2020年3月27日

【NeurIPS2019报告推荐】公平与表示学习—UIUC Sanmi Koyejo教授

【NeurIPS2019报告推荐】公平与表示学习—UIUC Sanmi Koyejo教授

专知会员服务

44+阅读 · 2019年12月24日

【课程】概率图模型，卡内基梅隆大学邢波

【课程】概率图模型，卡内基梅隆大学邢波

专知会员服务

70+阅读 · 2019年11月4日

【MIT-伯克利-ICLR2020】对比表示蒸馏，Contrastive Representation Distillation

【MIT-伯克利-ICLR2020】对比表示蒸馏，Contrastive Representation Distillation

专知

54+阅读 · 2020年3月12日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

77+阅读 · 2019年10月20日

【图灵奖得主Judea Pearl推荐新书】图模型(Graphical Models), 571页pdf，带你学习GM和因果推断

【图灵奖得主Judea Pearl推荐新书】图模型(Graphical Models), 571页pdf，带你学习GM和因果推断

专知

67+阅读 · 2019年9月26日

实验室学生参加 IJCAI 2019会议并做报告

实验室学生参加 IJCAI 2019会议并做报告

inpluslab

16+阅读 · 2019年8月25日

图数据表示学习综述论文

图数据表示学习综述论文

专知

52+阅读 · 2019年6月10日

注意力能提高模型可解释性？实验表明：并没有

注意力能提高模型可解释性？实验表明：并没有

黑龙江大学自然语言处理实验室

11+阅读 · 2019年4月16日

Transformer-XL：释放注意力模型的潜力

Transformer-XL：释放注意力模型的潜力

谷歌开发者

31+阅读 · 2019年2月19日

KDD 2018 | 微软推出用于因果推断的Python库——DoWhy

KDD 2018 | 微软推出用于因果推断的Python库——DoWhy

论智

31+阅读 · 2018年8月24日

学界 | 哈佛大学提出变分注意力：用VAE重建注意力机制

学界 | 哈佛大学提出变分注意力：用VAE重建注意力机制

机器之心

7+阅读 · 2018年7月26日

多伦多大学“神经网络与机器学习导论（2018年春季）

多伦多大学“神经网络与机器学习导论（2018年春季）

人工智能头条

14+阅读 · 2018年4月3日

M2GRL: A Multi-task Multi-view Graph Representation Learning Framework for Web-scale Recommender Systems

Arxiv

8+阅读 · 2020年6月1日

Generating Rationales in Visual Question Answering

Generating Rationales in Visual Question Answering

Arxiv

5+阅读 · 2020年4月4日

TinyBERT: Distilling BERT for Natural Language Understanding

TinyBERT: Distilling BERT for Natural Language Understanding

Arxiv

11+阅读 · 2019年9月23日

Meta-Learning with Differentiable Convex Optimization

Arxiv

5+阅读 · 2019年4月23日

Few-shot Learning with Meta Metric Learners

Arxiv

13+阅读 · 2019年1月26日

Physical Primitive Decomposition

Physical Primitive Decomposition

Arxiv

4+阅读 · 2018年9月13日

ClusterGAN : Latent Space Clustering in Generative Adversarial Networks

ClusterGAN : Latent Space Clustering in Generative Adversarial Networks

Arxiv

10+阅读 · 2018年9月10日

Large Margin Few-Shot Learning

Arxiv

11+阅读 · 2018年7月8日

Depth Masked Discriminative Correlation Filter

Arxiv

7+阅读 · 2018年2月26日

Learning to Count Objects in Natural Images for Visual Question Answering

Arxiv

12+阅读 · 2018年2月15日

VIP会员

相关主题

深度语言表示

相关VIP内容

【ICML2020】深度神经网络置信感知学习，Conﬁdence-Aware Learning for Deep Neural Networks

【ICML2020】深度神经网络置信感知学习，Conﬁdence-Aware Learning for Deep Neural Networks

专知会员服务

74+阅读 · 2020年7月6日

【ICML2020-上海交大】多智能体确定性Q-Learning， Multi-Agent Determinantal Q-Learning

【ICML2020-上海交大】多智能体确定性Q-Learning， Multi-Agent Determinantal Q-Learning

专知会员服务

38+阅读 · 2020年6月3日

【ICML2020】小样本目标检测

【ICML2020】小样本目标检测

专知会员服务

91+阅读 · 2020年6月2日

【哈佛大学】机器学习的黑盒解释性，52页ppt

【哈佛大学】机器学习的黑盒解释性，52页ppt

专知会员服务

172+阅读 · 2020年5月27日

【微软亚研】预训练文本表示作为元学习，Pre-training Text Representations

【微软亚研】预训练文本表示作为元学习，Pre-training Text Representations

专知会员服务

40+阅读 · 2020年4月17日

【微软-ACL2020】TinyMBERT: Multi-Stage Distillation Framework for Massive Multi-lingual NER

【微软-ACL2020】TinyMBERT: Multi-Stage Distillation Framework for Massive Multi-lingual NER

专知会员服务

36+阅读 · 2020年4月14日

【ACL2020-伯克利】预训练Transformer提高分布外鲁棒性

【ACL2020-伯克利】预训练Transformer提高分布外鲁棒性

专知会员服务

20+阅读 · 2020年4月14日

【ICML2020投稿论文-CMU-DeepMind-Google】用于评估跨语言泛化的大规模多语言多任务基准

【ICML2020投稿论文-CMU-DeepMind-Google】用于评估跨语言泛化的大规模多语言多任务基准

专知会员服务

14+阅读 · 2020年3月27日

【NeurIPS2019报告推荐】公平与表示学习—UIUC Sanmi Koyejo教授

【NeurIPS2019报告推荐】公平与表示学习—UIUC Sanmi Koyejo教授

专知会员服务

44+阅读 · 2019年12月24日

【课程】概率图模型，卡内基梅隆大学邢波

【课程】概率图模型，卡内基梅隆大学邢波

专知会员服务

70+阅读 · 2019年11月4日

热门VIP内容

开通专知VIP会员享更多权益服务

【新书】基于物理的模拟

流匹配在生物学与生命科学中的应用综述

高质量数据集实践指南（1.0）

ICML 2025 关于语言模型机械可解释性的教程

相关资讯

【MIT-伯克利-ICLR2020】对比表示蒸馏，Contrastive Representation Distillation

【MIT-伯克利-ICLR2020】对比表示蒸馏，Contrastive Representation Distillation

专知

54+阅读 · 2020年3月12日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

77+阅读 · 2019年10月20日

【图灵奖得主Judea Pearl推荐新书】图模型(Graphical Models), 571页pdf，带你学习GM和因果推断

【图灵奖得主Judea Pearl推荐新书】图模型(Graphical Models), 571页pdf，带你学习GM和因果推断

专知

67+阅读 · 2019年9月26日

实验室学生参加 IJCAI 2019会议并做报告

实验室学生参加 IJCAI 2019会议并做报告

inpluslab

16+阅读 · 2019年8月25日

图数据表示学习综述论文

图数据表示学习综述论文

专知

52+阅读 · 2019年6月10日

注意力能提高模型可解释性？实验表明：并没有

注意力能提高模型可解释性？实验表明：并没有

黑龙江大学自然语言处理实验室

11+阅读 · 2019年4月16日

Transformer-XL：释放注意力模型的潜力

Transformer-XL：释放注意力模型的潜力

谷歌开发者

31+阅读 · 2019年2月19日

KDD 2018 | 微软推出用于因果推断的Python库——DoWhy

KDD 2018 | 微软推出用于因果推断的Python库——DoWhy

论智

31+阅读 · 2018年8月24日

学界 | 哈佛大学提出变分注意力：用VAE重建注意力机制

学界 | 哈佛大学提出变分注意力：用VAE重建注意力机制

机器之心

7+阅读 · 2018年7月26日

多伦多大学“神经网络与机器学习导论（2018年春季）

多伦多大学“神经网络与机器学习导论（2018年春季）

人工智能头条

14+阅读 · 2018年4月3日

相关论文

M2GRL: A Multi-task Multi-view Graph Representation Learning Framework for Web-scale Recommender Systems

Arxiv

8+阅读 · 2020年6月1日

Generating Rationales in Visual Question Answering

Generating Rationales in Visual Question Answering

Arxiv

5+阅读 · 2020年4月4日

TinyBERT: Distilling BERT for Natural Language Understanding

TinyBERT: Distilling BERT for Natural Language Understanding

Arxiv

11+阅读 · 2019年9月23日

Meta-Learning with Differentiable Convex Optimization

Arxiv

5+阅读 · 2019年4月23日

Few-shot Learning with Meta Metric Learners

Arxiv

13+阅读 · 2019年1月26日

Physical Primitive Decomposition

Physical Primitive Decomposition

Arxiv

4+阅读 · 2018年9月13日

ClusterGAN : Latent Space Clustering in Generative Adversarial Networks

ClusterGAN : Latent Space Clustering in Generative Adversarial Networks

Arxiv

10+阅读 · 2018年9月10日

Large Margin Few-Shot Learning

Arxiv

11+阅读 · 2018年7月8日

Depth Masked Discriminative Correlation Filter

Arxiv

7+阅读 · 2018年2月26日

Learning to Count Objects in Natural Images for Visual Question Answering

Arxiv

12+阅读 · 2018年2月15日

微信扫码咨询专知VIP会员