The goal of generative phonology, as formulated by Chomsky and Halle (1968), is to specify a formal system that explains the set of attested phonological strings in a language. Traditionally, a collection of rules (or constraints, in the case of optimality theory) and underlying forms (UF) are posited to work in tandem to generate phonological strings. However, the degree of abstraction of UFs with respect to their concrete realizations is contentious. As the main contribution of our work, we implement the phonological generative system as a neural model differentiable end-to-end, rather than as a set of rules or constraints. Contrary to traditional phonology, in our model, UFs are continuous vectors in $\mathbb{R}^d$, rather than discrete strings. As a consequence, UFs are discovered automatically rather than posited by linguists, and the model can scale to the size of a realistic vocabulary. Moreover, we compare several modes of the generative process, contemplating: i) the presence or absence of an underlying representation in between morphemes and surface forms (SFs); and ii) the conditional dependence or independence of UFs with respect to SFs. We evaluate the ability of each mode to predict attested phonological strings on 2 datasets covering 5 and 28 languages, respectively. The results corroborate two tenets of generative phonology, viz. the necessity for UFs and their independence from SFs. In general, our neural model of generative phonology learns both UFs and SFs automatically and on a large-scale.


翻译:由Chomsky和Halle(1968年)所制定的基因质谱学的目标是指定一个正式系统,用一种语言来解释一套经证明的声乐字符串。传统上,一套规则(或约束,在最佳理论方面)和基本形式(UF)被假定为协同工作,以产生声乐字符串。然而,在具体实现方面,UF的抽象程度是有争议的。作为我们工作的主要贡献,我们把声调基因质谱系统作为一种神经模型,而不是一套规则或约束。与传统的声调学相反,在我们的模式中,UF是美元(或制约,在最佳理论理论方面)和基本形式(UF)的连续矢量。结果,UF是自动发现的,而不是语言学家的假设,而模型可以缩放到现实词汇的大小。此外,我们比较了几种配方的语谱化过程,我们思考了:是否存在或没有在表层和表层规则或约束下一套规则或约束。 与我们模式的货币质变的货币系的可靠性、我们货币系的可靠性和货币质变的可靠性分别评估了我们货币质变的可靠性的可靠性和货币系的可靠性的可靠性的可靠性,我们对货币系的可靠性的可靠性的可靠性的可靠性的可靠性的可靠性的可靠性和稳定性的可靠性和稳定性的可靠性的可靠性的可靠性的可靠性的可靠性和稳定性的可靠性和可靠性,我们性能性能性能的可靠性的可靠性的可靠性的可靠性的可靠性的可靠性的可靠性的可靠性的可靠性。

0
下载
关闭预览

相关内容

【干货书】机器学习速查手册,135页pdf
专知会员服务
122+阅读 · 2020年11月20日
专知会员服务
158+阅读 · 2020年1月16日
强化学习最新教程,17页pdf
专知会员服务
168+阅读 · 2019年10月11日
机器学习入门的经验与建议
专知会员服务
90+阅读 · 2019年10月10日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
99+阅读 · 2019年10月9日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
命名实体识别(NER)综述
AI研习社
65+阅读 · 2019年1月30日
【NIPS2018】接收论文列表
专知
5+阅读 · 2018年9月10日
自然语言处理顶会EMNLP2018接受论文列表!
专知
87+阅读 · 2018年8月26日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
计算机视觉近一年进展综述
机器学习研究会
8+阅读 · 2017年11月25日
MoCoGAN 分解运动和内容的视频生成
CreateAMind
18+阅读 · 2017年10月21日
【推荐】GAN架构入门综述(资源汇总)
机器学习研究会
10+阅读 · 2017年9月3日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Arxiv
0+阅读 · 2021年4月5日
Arxiv
0+阅读 · 2021年4月4日
Arxiv
0+阅读 · 2021年4月2日
Arxiv
5+阅读 · 2018年5月1日
Arxiv
3+阅读 · 2018年4月3日
Arxiv
10+阅读 · 2018年3月23日
Arxiv
7+阅读 · 2018年1月30日
Arxiv
7+阅读 · 2018年1月21日
VIP会员
相关资讯
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
命名实体识别(NER)综述
AI研习社
65+阅读 · 2019年1月30日
【NIPS2018】接收论文列表
专知
5+阅读 · 2018年9月10日
自然语言处理顶会EMNLP2018接受论文列表!
专知
87+阅读 · 2018年8月26日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
计算机视觉近一年进展综述
机器学习研究会
8+阅读 · 2017年11月25日
MoCoGAN 分解运动和内容的视频生成
CreateAMind
18+阅读 · 2017年10月21日
【推荐】GAN架构入门综述(资源汇总)
机器学习研究会
10+阅读 · 2017年9月3日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
相关论文
Arxiv
0+阅读 · 2021年4月5日
Arxiv
0+阅读 · 2021年4月4日
Arxiv
0+阅读 · 2021年4月2日
Arxiv
5+阅读 · 2018年5月1日
Arxiv
3+阅读 · 2018年4月3日
Arxiv
10+阅读 · 2018年3月23日
Arxiv
7+阅读 · 2018年1月30日
Arxiv
7+阅读 · 2018年1月21日
Top
微信扫码咨询专知VIP会员