【ICML2023】Transformer编码器表达能力的更严格界限 - 专知VIP

会员服务 ·

20

ICML 2023 · Transformer · 编码器 ·

2023 年 4 月 27 日

【ICML2023】Transformer编码器表达能力的更严格界限

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

从更好理解的形式系统的角度来描述神经网络，有可能产生对这些网络的力量和局限性的新见解。对于transformer来说，这仍然是一个活跃的研究领域。Bhattamishra和其他人已经表明，transformer编码器的表达能力至少与某种计数器机器一样强，而Merrill和Sabharwal已经表明，固定精度的transformer编码器只能识别统一TC中的语言。通过识别具有计数量词的一阶逻辑变体，将这些结果联系起来并加强，该变体同时是固定精度transformer编码器的上界和transformer编码器的下界。这使我们比以前更接近transformer编码器识别的语言的确切特征。

https://www.zhuanzhi.ai/paper/571bd61949e3574aa0b115cf779fbb9e

成为VIP会员查看完整内容

31

相关内容

ICML 2023

国际机器学习大会(International Conference on Machine Learning，简称ICML ) 是由国际机器学习学会（IMLS）主办的机器学习国际顶级会议。 2023年7月23日至29日周六在夏威夷会议中心举行。

【ICML2023】无消息传递的transformer图归纳偏差

【ICML2023】无消息传递的transformer图归纳偏差

专知会员服务

26+阅读 · 2023年6月1日

【ICML2022】时序自监督视频transformer

【ICML2022】时序自监督视频transformer

专知会员服务

31+阅读 · 2022年7月28日

【ICML2022】在线决策Transformer

【ICML2022】在线决策Transformer

专知会员服务

34+阅读 · 2022年7月27日

【ICML2022】Transformer是元强化学习器

【ICML2022】Transformer是元强化学习器

专知会员服务

56+阅读 · 2022年6月15日

【ICML2021】深度隐式图匹配

专知会员服务

25+阅读 · 2021年9月22日

【ICML2021】使用Transformers编码的计算感知神经架构

专知会员服务

18+阅读 · 2021年9月15日

【ICML2021】深度残差网络的可扩展特性

专知会员服务

20+阅读 · 2021年5月30日

【ICML2021】基于经典迭代算法的图神经网络

专知会员服务

30+阅读 · 2021年5月21日

【ICML2021】具有线性复杂度的Transformer的相对位置编码

【ICML2021】具有线性复杂度的Transformer的相对位置编码

专知会员服务

25+阅读 · 2021年5月20日

【ICML2021】有向图网络

专知会员服务

82+阅读 · 2021年5月10日

【TPAMI2022】TransCL：基于Transformer的压缩学习，更灵活更强大

【TPAMI2022】TransCL：基于Transformer的压缩学习，更灵活更强大

专知

4+阅读 · 2022年8月2日

【KDD2022】自监督超图Transformer推荐系统

【KDD2022】自监督超图Transformer推荐系统

专知

1+阅读 · 2022年8月1日

【ICML2022】时序自监督视频transformer

【ICML2022】时序自监督视频transformer

专知

1+阅读 · 2022年7月28日

【ICML2022】在线决策Transformer

【ICML2022】在线决策Transformer

专知

2+阅读 · 2022年7月27日

【ICML2022】基于少样本策略泛化的决策Transformer

【ICML2022】基于少样本策略泛化的决策Transformer

专知

3+阅读 · 2022年7月11日

【ICML2022】基于自适应上下文池化的高效表示学习

【ICML2022】基于自适应上下文池化的高效表示学习

专知

0+阅读 · 2022年7月9日

【ICML2022】通过能量最小化学习迭代推理

【ICML2022】通过能量最小化学习迭代推理

专知

0+阅读 · 2022年7月3日

深度学习的下一步：Transformer和注意力机制

深度学习的下一步：Transformer和注意力机制

云头条

56+阅读 · 2019年9月14日

ACL 2019 | 多语言BERT的语言表征探索

ACL 2019 | 多语言BERT的语言表征探索

AI科技评论

21+阅读 · 2019年9月6日

深入理解BERT Transformer ，不仅仅是注意力机制

深入理解BERT Transformer ，不仅仅是注意力机制

大数据文摘

22+阅读 · 2019年3月19日

扩展的线性时段不变式的模型检验

国家自然科学基金

1+阅读 · 2014年12月31日

认知重评影响惊恐障碍患者情绪调节能力的脑机制

国家自然科学基金

0+阅读 · 2013年12月31日

非小细胞肺癌中C/EBP β对ATM/ATR和放疗敏感性的作用研究

国家自然科学基金

0+阅读 · 2013年12月31日

通过转基因小鼠模型在转录组和代谢组水平上解析GLUD2基因在人类认知功能进化过程中的调控机制

国家自然科学基金

0+阅读 · 2013年12月31日

集合组合性质与计算性质间的关系

国家自然科学基金

0+阅读 · 2013年12月31日

混成系统微分不变式计算理论方法

国家自然科学基金

0+阅读 · 2012年12月31日

AML1-ETO与HIF1a协同调控DNA甲基化促进AML发生/复发的新机制

国家自然科学基金

0+阅读 · 2012年12月31日

三维海洋模式空间分布参数设置的伴随法实现及应用

国家自然科学基金

0+阅读 · 2012年12月31日

形状记忆聚合物双程自组装体系设计、制备和实验表征

国家自然科学基金

0+阅读 · 2012年12月31日

海洋藻红蛋白适应弱光的分子机制

国家自然科学基金

0+阅读 · 2011年12月31日

DFormer: Diffusion-guided Transformer for Universal Image Segmentation

Arxiv

0+阅读 · 2023年6月8日

Multimodal Learning with Transformers: A Survey

Arxiv

69+阅读 · 2022年6月13日

A Survey on Vision Transformer

Arxiv

17+阅读 · 2022年2月23日

Nested Hierarchical Transformer: Towards Accurate, Data-Efficient and Interpretable Visual Understanding

Arxiv

12+阅读 · 2021年12月30日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

Unifying Vision-and-Language Tasks via Text Generation

Arxiv

10+阅读 · 2021年2月4日

A Survey on Visual Transformer

Arxiv

19+阅读 · 2020年12月23日

ERNIE-ViL: Knowledge Enhanced Vision-Language Representations Through Scene Graph

Arxiv

11+阅读 · 2020年7月31日

Graph Transformer Networks

Arxiv

15+阅读 · 2020年2月5日

Infusing Knowledge into the Textual Entailment Task Using Graph Convolutional Networks

Infusing Knowledge into the Textual Entailment Task Using Graph Convolutional Networks

Arxiv

23+阅读 · 2019年11月5日

VIP会员

相关主题

相关VIP内容

【ICML2023】无消息传递的transformer图归纳偏差

【ICML2023】无消息传递的transformer图归纳偏差

专知会员服务

26+阅读 · 2023年6月1日

【ICML2022】时序自监督视频transformer

【ICML2022】时序自监督视频transformer

专知会员服务

31+阅读 · 2022年7月28日

【ICML2022】在线决策Transformer

【ICML2022】在线决策Transformer

专知会员服务

34+阅读 · 2022年7月27日

【ICML2022】Transformer是元强化学习器

【ICML2022】Transformer是元强化学习器

专知会员服务

56+阅读 · 2022年6月15日

【ICML2021】深度隐式图匹配

专知会员服务

25+阅读 · 2021年9月22日

【ICML2021】使用Transformers编码的计算感知神经架构

专知会员服务

18+阅读 · 2021年9月15日

【ICML2021】深度残差网络的可扩展特性

专知会员服务

20+阅读 · 2021年5月30日

【ICML2021】基于经典迭代算法的图神经网络

专知会员服务

30+阅读 · 2021年5月21日

【ICML2021】具有线性复杂度的Transformer的相对位置编码

【ICML2021】具有线性复杂度的Transformer的相对位置编码

专知会员服务

25+阅读 · 2021年5月20日

【ICML2021】有向图网络

专知会员服务

82+阅读 · 2021年5月10日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】低维与高维空间中潜在表征的分析、建模与变换

《生态建模密码破译：建模与编程实践》美陆军最新报告

大模型解决方案白皮书：社交陪伴场景全流程落地指南

面向具身操作的视觉-语言-动作模型综述

相关资讯

【TPAMI2022】TransCL：基于Transformer的压缩学习，更灵活更强大

【TPAMI2022】TransCL：基于Transformer的压缩学习，更灵活更强大

专知

4+阅读 · 2022年8月2日

【KDD2022】自监督超图Transformer推荐系统

【KDD2022】自监督超图Transformer推荐系统

专知

1+阅读 · 2022年8月1日

【ICML2022】时序自监督视频transformer

【ICML2022】时序自监督视频transformer

专知

1+阅读 · 2022年7月28日

【ICML2022】在线决策Transformer

【ICML2022】在线决策Transformer

专知

2+阅读 · 2022年7月27日

【ICML2022】基于少样本策略泛化的决策Transformer

【ICML2022】基于少样本策略泛化的决策Transformer

专知

3+阅读 · 2022年7月11日

【ICML2022】基于自适应上下文池化的高效表示学习

【ICML2022】基于自适应上下文池化的高效表示学习

专知

0+阅读 · 2022年7月9日

【ICML2022】通过能量最小化学习迭代推理

【ICML2022】通过能量最小化学习迭代推理

专知

0+阅读 · 2022年7月3日

深度学习的下一步：Transformer和注意力机制

深度学习的下一步：Transformer和注意力机制

云头条

56+阅读 · 2019年9月14日

ACL 2019 | 多语言BERT的语言表征探索

ACL 2019 | 多语言BERT的语言表征探索

AI科技评论

21+阅读 · 2019年9月6日

深入理解BERT Transformer ，不仅仅是注意力机制

深入理解BERT Transformer ，不仅仅是注意力机制

大数据文摘

22+阅读 · 2019年3月19日

相关基金

扩展的线性时段不变式的模型检验

国家自然科学基金

1+阅读 · 2014年12月31日

认知重评影响惊恐障碍患者情绪调节能力的脑机制

国家自然科学基金

0+阅读 · 2013年12月31日

非小细胞肺癌中C/EBP β对ATM/ATR和放疗敏感性的作用研究

国家自然科学基金

0+阅读 · 2013年12月31日

通过转基因小鼠模型在转录组和代谢组水平上解析GLUD2基因在人类认知功能进化过程中的调控机制

国家自然科学基金

0+阅读 · 2013年12月31日

集合组合性质与计算性质间的关系

国家自然科学基金

0+阅读 · 2013年12月31日

混成系统微分不变式计算理论方法

国家自然科学基金

0+阅读 · 2012年12月31日

AML1-ETO与HIF1a协同调控DNA甲基化促进AML发生/复发的新机制

国家自然科学基金

0+阅读 · 2012年12月31日

三维海洋模式空间分布参数设置的伴随法实现及应用

国家自然科学基金

0+阅读 · 2012年12月31日

形状记忆聚合物双程自组装体系设计、制备和实验表征

国家自然科学基金

0+阅读 · 2012年12月31日

海洋藻红蛋白适应弱光的分子机制

国家自然科学基金

0+阅读 · 2011年12月31日

相关论文

DFormer: Diffusion-guided Transformer for Universal Image Segmentation

Arxiv

0+阅读 · 2023年6月8日

Multimodal Learning with Transformers: A Survey

Arxiv

69+阅读 · 2022年6月13日

A Survey on Vision Transformer

Arxiv

17+阅读 · 2022年2月23日

Nested Hierarchical Transformer: Towards Accurate, Data-Efficient and Interpretable Visual Understanding

Arxiv

12+阅读 · 2021年12月30日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

Unifying Vision-and-Language Tasks via Text Generation

Arxiv

10+阅读 · 2021年2月4日

A Survey on Visual Transformer

Arxiv

19+阅读 · 2020年12月23日

ERNIE-ViL: Knowledge Enhanced Vision-Language Representations Through Scene Graph

Arxiv

11+阅读 · 2020年7月31日

Graph Transformer Networks

Arxiv

15+阅读 · 2020年2月5日

Infusing Knowledge into the Textual Entailment Task Using Graph Convolutional Networks

Infusing Knowledge into the Textual Entailment Task Using Graph Convolutional Networks

Arxiv

23+阅读 · 2019年11月5日

微信扫码咨询专知VIP会员