翻译标题：数学表达式在连续向量空间中的语义表示翻译摘要：数学符号占据了STEM文献的大部分，然而，找到公式的语义表示仍然是一个具有挑战性的问题。由于数学符号是精确的，而且只要有微小的字符偏移，其含义就会发生显著变化，因此有效的自然文本方法并不一定适用于数学表达式。在这项工作中，我们描述了一种在连续向量空间中表示数学表达式的方法。我们使用sequence-to-sequence架构的编码器，对不同但数学上等效的表达式进行训练，以生成向量表示（或嵌入）。我们将这种方法与自编码器进行比较，并表明前者更能捕捉数学语义。最后，为加速未来的研究，我们发布了一个等效的超越和代数表达式对的语料库。 (Semantic Representations of Mathematical Expressions in a Continuous Vector Space) - 专知论文

会员服务 ·

0

数学 · 向量空间 · 等效 · 语义表示 · 表示 ·

2023 年 3 月 31 日

Semantic Representations of Mathematical Expressions in a Continuous Vector Space

翻译：翻译标题：数学表达式在连续向量空间中的语义表示翻译摘要：数学符号占据了STEM文献的大部分，然而，找到公式的语义表示仍然是一个具有挑战性的问题。由于数学符号是精确的，而且只要有微小的字符偏移，其含义就会发生显著变化，因此有效的自然文本方法并不一定适用于数学表达式。在这项工作中，我们描述了一种在连续向量空间中表示数学表达式的方法。我们使用sequence-to-sequence架构的编码器，对不同但数学上等效的表达式进行训练，以生成向量表示（或嵌入）。我们将这种方法与自编码器进行比较，并表明前者更能捕捉数学语义。最后，为加速未来的研究，我们发布了一个等效的超越和代数表达式对的语料库。

Neeraj Gangwar,Nickvash Kani

from arxiv, 17 pages, 2 figures

Mathematical notation makes up a large portion of STEM literature, yet, finding semantic representations for formulae remains a challenging problem. Because mathematical notation is precise, and its meaning changes significantly with small character shifts, the methods that work for natural text do not necessarily work well for mathematical expressions. In this work, we describe an approach for representing mathematical expressions in a continuous vector space. We use the encoder of a sequence-to-sequence architecture, trained on visually different but mathematically equivalent expressions, to generate vector representations (or embeddings). We compare this approach with an autoencoder and show that the former is better at capturing mathematical semantics. Finally, to expedite future research, we publish a corpus of equivalent transcendental and algebraic expression pairs.

翻译：

0

相关内容

数学是关于数量、结构、变化等主题的探索。

ICLR 2022杰出论文公布：7篇论文获得，清华朱军课题组摘得

ICLR 2022杰出论文公布：7篇论文获得，清华朱军课题组摘得

专知会员服务

60+阅读 · 2022年4月22日

【计算所&清华等新书】预训练方法信息检索，109页pdf

【计算所&清华等新书】预训练方法信息检索，109页pdf

专知会员服务

65+阅读 · 2021年11月30日

知识增强预训练语言模型:全面综述

知识增强预训练语言模型:全面综述

专知会员服务

93+阅读 · 2021年10月19日

NLP必读经典文献100篇

专知会员服务

124+阅读 · 2020年9月8日

最新《图神经网络模型》概述，21页pdf

专知会员服务

137+阅读 · 2020年8月24日

史上最全！358篇机器学习&自然语言处理综述论文！都这儿了

专知会员服务

129+阅读 · 2020年7月18日

【ACL2020】DeeBERT:动态加速BERT推理，DeeBERT: Dynamic Early Exiting for Accelerating BERT Inference

【ACL2020】DeeBERT:动态加速BERT推理，DeeBERT: Dynamic Early Exiting for Accelerating BERT Inference

专知会员服务

21+阅读 · 2020年4月30日

【论文翻译】NLP注意力机制综述论文翻译，Attention, please! A Critical Review of Neural Attention Models in Natural Language Processing

【论文翻译】NLP注意力机制综述论文翻译，Attention, please! A Critical Review of Neural Attention Models in Natural Language Processing

专知会员服务

96+阅读 · 2020年4月18日

【ICLR2020论文】自我注意力与卷积层的关系，On the Relationship between Self-Attention and Convolutional Layers

【ICLR2020论文】自我注意力与卷积层的关系，On the Relationship between Self-Attention and Convolutional Layers

专知会员服务

37+阅读 · 2020年1月12日

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

专知会员服务

41+阅读 · 2019年10月9日

几种句子表示方法的比较

几种句子表示方法的比较

AINLP

15+阅读 · 2019年9月21日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

上百种预训练中文词向量：Chinese-Word-Vectors

上百种预训练中文词向量：Chinese-Word-Vectors

AINLP

23+阅读 · 2019年2月26日

【论文推荐】最新六篇主题模型相关论文—领域特定知识库、神经变分推断、动态和静态主题模型

【论文推荐】最新六篇主题模型相关论文—领域特定知识库、神经变分推断、动态和静态主题模型

专知

19+阅读 · 2018年6月26日

【论文推荐】最新四篇CVPR2018 视频描述生成相关论文—双向注意力、Transformer、重构网络、层次强化学习

【论文推荐】最新四篇CVPR2018 视频描述生成相关论文—双向注意力、Transformer、重构网络、层次强化学习

专知

31+阅读 · 2018年6月4日

【论文推荐】最新八篇视频描述生成相关论文—在线视频理解、联合定位和描述事件、生成视频、跨模态注意力机制、联合事件检测和描述

【论文推荐】最新八篇视频描述生成相关论文—在线视频理解、联合定位和描述事件、生成视频、跨模态注意力机制、联合事件检测和描述

专知

11+阅读 · 2018年6月4日

【论文推荐】最新十篇机器翻译相关论文—自然语言推理、无监督神经机器翻译、多任务学习、局部卷积、图卷积、多语种机器翻译

【论文推荐】最新十篇机器翻译相关论文—自然语言推理、无监督神经机器翻译、多任务学习、局部卷积、图卷积、多语种机器翻译

专知

15+阅读 · 2018年5月1日

【论文推荐】最新七篇自注意力机制(Self-attention)相关论文—结构化自注意力、相对位置、混合、句子表达、文本向量

【论文推荐】最新七篇自注意力机制(Self-attention)相关论文—结构化自注意力、相对位置、混合、句子表达、文本向量

专知

29+阅读 · 2018年3月12日

【论文推荐】最新六篇图像描述生成相关论文—视频摘要、注意力张量积、非自回归神经序列模型、副词识别、多主体、多样性度量

【论文推荐】最新六篇图像描述生成相关论文—视频摘要、注意力张量积、非自回归神经序列模型、副词识别、多主体、多样性度量

专知

10+阅读 · 2018年3月2日

可解释的CNN

可解释的CNN

CreateAMind

17+阅读 · 2017年10月5日

曲率，第二基本形式与几何算子的相似性的研究

国家自然科学基金

2+阅读 · 2014年12月31日

多辛保结构变分数值方法及非标准有限差分方法在其上的应用

国家自然科学基金

0+阅读 · 2013年12月31日

随机变量结构的模型论

国家自然科学基金

0+阅读 · 2013年12月31日

平移不变子空间的结构

国家自然科学基金

0+阅读 · 2013年12月31日

非自治动力系统拉回指数吸引子的存在性及其应用研究

国家自然科学基金

0+阅读 · 2012年12月31日

希尔伯特空间以及矩阵理论在HOL4中的形式化

国家自然科学基金

0+阅读 · 2011年12月31日

高精细模型的向量位移映射表示及几何处理

国家自然科学基金

0+阅读 · 2011年12月31日

生物计算机粘贴模型及其广义编码研究

国家自然科学基金

0+阅读 · 2009年12月31日

编码密码学中若干组合对象研究

国家自然科学基金

0+阅读 · 2009年12月31日

汉语文语转换中语义与表现力联合建模

国家自然科学基金

0+阅读 · 2008年12月31日

Greedy Poisson Rejection Sampling

Arxiv

0+阅读 · 2023年5月24日

L-CAD: Language-based Colorization with Any-level Descriptions

Arxiv

0+阅读 · 2023年5月24日

Revisit and Outstrip Entity Alignment: A Perspective of Generative Models

Arxiv

0+阅读 · 2023年5月24日

Compositional Text-to-Image Synthesis with Attention Map Control of Diffusion Models

Arxiv

0+阅读 · 2023年5月23日

Logical Entity Representation in Knowledge-Graphs for Differentiable Rule Learning

Arxiv

0+阅读 · 2023年5月22日

Prompting with Pseudo-Code Instructions

Prompting with Pseudo-Code Instructions

Arxiv

0+阅读 · 2023年5月19日

Knowledge Graph Embedding: A Survey from the Perspective of Representation Spaces

Arxiv

18+阅读 · 2022年11月7日

Linguistically-Informed Self-Attention for Semantic Role Labeling

Arxiv

17+阅读 · 2018年8月28日

Question Answering over Freebase via Attentive RNN with Similarity Matrix based CNN

Arxiv

11+阅读 · 2018年5月27日

CNN+CNN: Convolutional Decoders for Image Captioning

Arxiv

21+阅读 · 2018年5月23日

VIP会员

文章信息

相关主题

相关VIP内容

ICLR 2022杰出论文公布：7篇论文获得，清华朱军课题组摘得

ICLR 2022杰出论文公布：7篇论文获得，清华朱军课题组摘得

专知会员服务

60+阅读 · 2022年4月22日

【计算所&清华等新书】预训练方法信息检索，109页pdf

【计算所&清华等新书】预训练方法信息检索，109页pdf

专知会员服务

65+阅读 · 2021年11月30日

知识增强预训练语言模型:全面综述

知识增强预训练语言模型:全面综述

专知会员服务

93+阅读 · 2021年10月19日

NLP必读经典文献100篇

专知会员服务

124+阅读 · 2020年9月8日

最新《图神经网络模型》概述，21页pdf

专知会员服务

137+阅读 · 2020年8月24日

史上最全！358篇机器学习&自然语言处理综述论文！都这儿了

专知会员服务

129+阅读 · 2020年7月18日

【ACL2020】DeeBERT:动态加速BERT推理，DeeBERT: Dynamic Early Exiting for Accelerating BERT Inference

【ACL2020】DeeBERT:动态加速BERT推理，DeeBERT: Dynamic Early Exiting for Accelerating BERT Inference

专知会员服务

21+阅读 · 2020年4月30日

【论文翻译】NLP注意力机制综述论文翻译，Attention, please! A Critical Review of Neural Attention Models in Natural Language Processing

【论文翻译】NLP注意力机制综述论文翻译，Attention, please! A Critical Review of Neural Attention Models in Natural Language Processing

专知会员服务

96+阅读 · 2020年4月18日

【ICLR2020论文】自我注意力与卷积层的关系，On the Relationship between Self-Attention and Convolutional Layers

【ICLR2020论文】自我注意力与卷积层的关系，On the Relationship between Self-Attention and Convolutional Layers

专知会员服务

37+阅读 · 2020年1月12日

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

专知会员服务

41+阅读 · 2019年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

人工智能治理的未来

模态感知的特征匹配：单一模态与跨模态技术的全面综述

无监督行人重识别研究综述

【牛津博士论文】面向神经影像应用的可扩展且可解释的空间模型

相关资讯

几种句子表示方法的比较

几种句子表示方法的比较

AINLP

15+阅读 · 2019年9月21日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

上百种预训练中文词向量：Chinese-Word-Vectors

上百种预训练中文词向量：Chinese-Word-Vectors

AINLP

23+阅读 · 2019年2月26日

【论文推荐】最新六篇主题模型相关论文—领域特定知识库、神经变分推断、动态和静态主题模型

【论文推荐】最新六篇主题模型相关论文—领域特定知识库、神经变分推断、动态和静态主题模型

专知

19+阅读 · 2018年6月26日

【论文推荐】最新四篇CVPR2018 视频描述生成相关论文—双向注意力、Transformer、重构网络、层次强化学习

【论文推荐】最新四篇CVPR2018 视频描述生成相关论文—双向注意力、Transformer、重构网络、层次强化学习

专知

31+阅读 · 2018年6月4日

【论文推荐】最新八篇视频描述生成相关论文—在线视频理解、联合定位和描述事件、生成视频、跨模态注意力机制、联合事件检测和描述

【论文推荐】最新八篇视频描述生成相关论文—在线视频理解、联合定位和描述事件、生成视频、跨模态注意力机制、联合事件检测和描述

专知

11+阅读 · 2018年6月4日

【论文推荐】最新十篇机器翻译相关论文—自然语言推理、无监督神经机器翻译、多任务学习、局部卷积、图卷积、多语种机器翻译

【论文推荐】最新十篇机器翻译相关论文—自然语言推理、无监督神经机器翻译、多任务学习、局部卷积、图卷积、多语种机器翻译

专知

15+阅读 · 2018年5月1日

【论文推荐】最新七篇自注意力机制(Self-attention)相关论文—结构化自注意力、相对位置、混合、句子表达、文本向量

【论文推荐】最新七篇自注意力机制(Self-attention)相关论文—结构化自注意力、相对位置、混合、句子表达、文本向量

专知

29+阅读 · 2018年3月12日

【论文推荐】最新六篇图像描述生成相关论文—视频摘要、注意力张量积、非自回归神经序列模型、副词识别、多主体、多样性度量

【论文推荐】最新六篇图像描述生成相关论文—视频摘要、注意力张量积、非自回归神经序列模型、副词识别、多主体、多样性度量

专知

10+阅读 · 2018年3月2日

可解释的CNN

可解释的CNN

CreateAMind

17+阅读 · 2017年10月5日

相关论文

Greedy Poisson Rejection Sampling

Arxiv

0+阅读 · 2023年5月24日

L-CAD: Language-based Colorization with Any-level Descriptions

Arxiv

0+阅读 · 2023年5月24日

Revisit and Outstrip Entity Alignment: A Perspective of Generative Models

Arxiv

0+阅读 · 2023年5月24日

Compositional Text-to-Image Synthesis with Attention Map Control of Diffusion Models

Arxiv

0+阅读 · 2023年5月23日

Logical Entity Representation in Knowledge-Graphs for Differentiable Rule Learning

Arxiv

0+阅读 · 2023年5月22日

Prompting with Pseudo-Code Instructions

Prompting with Pseudo-Code Instructions

Arxiv

0+阅读 · 2023年5月19日

Knowledge Graph Embedding: A Survey from the Perspective of Representation Spaces

Arxiv

18+阅读 · 2022年11月7日

Linguistically-Informed Self-Attention for Semantic Role Labeling

Arxiv

17+阅读 · 2018年8月28日

Question Answering over Freebase via Attentive RNN with Similarity Matrix based CNN

Arxiv

11+阅读 · 2018年5月27日

CNN+CNN: Convolutional Decoders for Image Captioning

Arxiv

21+阅读 · 2018年5月23日

相关基金

曲率，第二基本形式与几何算子的相似性的研究

国家自然科学基金

2+阅读 · 2014年12月31日

多辛保结构变分数值方法及非标准有限差分方法在其上的应用

国家自然科学基金

0+阅读 · 2013年12月31日

随机变量结构的模型论

国家自然科学基金

0+阅读 · 2013年12月31日

平移不变子空间的结构

国家自然科学基金

0+阅读 · 2013年12月31日

非自治动力系统拉回指数吸引子的存在性及其应用研究

国家自然科学基金

0+阅读 · 2012年12月31日

希尔伯特空间以及矩阵理论在HOL4中的形式化

国家自然科学基金

0+阅读 · 2011年12月31日

高精细模型的向量位移映射表示及几何处理

国家自然科学基金

0+阅读 · 2011年12月31日

生物计算机粘贴模型及其广义编码研究

国家自然科学基金

0+阅读 · 2009年12月31日

编码密码学中若干组合对象研究

国家自然科学基金

0+阅读 · 2009年12月31日

汉语文语转换中语义与表现力联合建模

国家自然科学基金

0+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员