中国境内语言概览

2020 年 10 月 7 日 AINLP

中国境内幅员辽阔,地大物博,不同的环境、地质和气候条件孕育了不同的民族,众多少数民族生活在这片960万平方公里的土地上,创造出了灿烂璀璨的文明。语言作为文明的载体和产物,同样在中华大地上落地生根,并开出了五彩斑斓的花朵。


根据历史比较语言学的研究,世界各种语言按照亲属关系被分为不同的语系,世界主要的九大语系有汉藏语系、印欧语系、阿尔泰语系、闪-含语系、乌拉尔语系、南岛语系、南亚语系、达罗毗荼语系和高加索语系。根据1987年中国社会科学院和澳大利亚人文科学院合作编制、由朗文出版(远东)有限公司出版的《中国语言地图集》,中国境内的语言就涵盖了汉藏语系、阿尔泰语系、南岛语系、南亚语系和印欧语系等五大语系,由我国56个民族所使用。



其中,在我国东北延吉地区主要由朝鲜族使用的朝鲜语的归属在语言类型学、历史比较语言学等学术研究中仍存在争议,不属于前述的五大语系。


汉族以及其他少数民族使用的汉语使用比例最高,分布最广,并且方言种类多样,具体分布情况可以参看之前的文章。其他语言主要由各个少数民族使用,其分布与我国境内少数民族的分布高度相关,总的来看,阿尔泰语系的语言主要分布在北方地区,此外北方地区还有部分印欧语系的语言;汉藏语系中的藏缅语族、壮侗语族和苗瑶语族主要分布在南方地区,此外南方地区还有南亚语系、南岛语系中的部分语言,具体分布如下:


内蒙古自治区及东北地区:阿尔泰语系中的蒙古语族和满-通古斯语族语言主要分布在这些地区,如蒙古语、满语、鄂伦春语等。


新疆维吾尔自治区:阿尔泰语系中的突厥语族语言主要分布在该地区,如维吾尔语、哈萨克语等;除此之外,由于新疆地区是连接中亚和东亚的重要地区,因此印欧语系中的部分语言如塔吉克语、俄语等也在分布在新疆部分地区。


西藏自治区:汉藏语系藏缅语族中的藏语主要分布在该地区。


西南地区:汉藏语系藏缅语族、壮侗语族、苗瑶语族中的语言大部分分布在西南地区,如藏缅语族中的傈僳语、纳西语、独龙语、怒语等分布在云南西部,壮侗语族中的壮语主要分布在广西、黎语主要分布在海南、侗语主要分布在贵州、傣语主要分布在云南,苗瑶语族主要分布在云南东南地区。南亚语系主要分布在云南西南地区。


台湾省:南岛语系分布在台湾省。


根据以上分析可以看到,我国境内的语言分布的复杂程度呈现出两个特征。一是边境地区的语言复杂度较高,并且语系跨度大,如云南南部与南亚国家接壤地区,新疆西部与中亚国家接壤地区。二是少数民族分布集中的地方语言复杂度高,如云贵地区等。


以上内容是根据《中国语言地图集》对中国境内语言分布的状况所做的简单梳理,中华文化博大精深,中国境内的语言也奥妙无穷,相信会有越来越多的人去发现、去研究、去探索。




由于微信平台算法改版,公号内容将不再以时间排序展示,如果大家想第一时间看到我们的推送,强烈建议星标我们和给我们多点点【在看】。星标具体步骤为:

(1)点击页面最上方"AINLP",进入公众号主页。

(2)点击右上角的小点点,在弹出页面点击“设为星标”,就可以啦。

感谢支持,比心


欢迎加入AINLP技术交流群
进群请添加AINLP小助手微信 AINLPer(id: ainlper),备注NLP技术交流

推荐阅读

这个NLP工具,玩得根本停不下来

征稿启示| 200元稿费+5000DBC(价值20个小时GPU算力)

完结撒花!李宏毅老师深度学习与人类语言处理课程视频及课件(附下载)

从数据到模型,你可能需要1篇详实的pytorch踩坑指南

如何让Bert在finetune小数据集时更“稳”一点

模型压缩实践系列之——bert-of-theseus,一个非常亲民的bert压缩方法

文本自动摘要任务的“不完全”心得总结番外篇——submodular函数优化

Node2Vec 论文+代码笔记

模型压缩实践收尾篇——模型蒸馏以及其他一些技巧实践小结

中文命名实体识别工具(NER)哪家强?

学自然语言处理,其实更应该学好英语

斯坦福大学NLP组Python深度学习自然语言处理工具Stanza试用

关于AINLP

AINLP 是一个有趣有AI的自然语言处理社区,专注于 AI、NLP、机器学习、深度学习、推荐算法等相关技术的分享,主题包括文本摘要、智能问答、聊天机器人、机器翻译、自动生成、知识图谱、预训练模型、推荐系统、计算广告、招聘信息、求职经验分享等,欢迎关注!加技术交流群请添加AINLPer(id:ainlper),备注工作/研究方向+加群目的。


阅读至此了,分享、点赞、在看三选一吧🙏

登录查看更多
0

相关内容

智源发布《2020北京人工智能发展报告》,附43页pdf
专知会员服务
127+阅读 · 2020年11月19日
 第八届中国科技大学《计算机图形学》暑期课程课件
专知会员服务
60+阅读 · 2020年3月4日
2019中国硬科技发展白皮书 193页
专知会员服务
83+阅读 · 2019年12月13日
 【中科院信工所】社交媒体情感分析,40页ppt
专知会员服务
103+阅读 · 2019年12月13日
【CAAI 2019】自然语言与理解,苏州大学| 周国栋教授
专知会员服务
63+阅读 · 2019年12月1日
【NLP】NLP未来发展趋势&ACL 2019回顾
产业智能官
5+阅读 · 2019年8月27日
ACL 2019年度回顾:自然语言处理发展趋势
人工智能学家
5+阅读 · 2019年8月19日
5G全产业链发展分析报告
行业研究报告
11+阅读 · 2019年6月7日
2019中国家政服务行业发展剖析及行业投资机遇分析报告
中国高速铁路信息化现状及智能化发展
科技导报
10+阅读 · 2019年4月19日
深度|拥抱人工智能报告:中国未来就业的挑战与应对
机器人大讲堂
6+阅读 · 2018年9月24日
《中国人工智能发展报告2018》(附PDF下载)
走向智能论坛
19+阅读 · 2018年7月17日
2018-2020年中国服务机器人行业深度研究报告
机器人大讲堂
5+阅读 · 2018年1月30日
Arxiv
1+阅读 · 2020年12月3日
Arxiv
0+阅读 · 2020年12月3日
Arxiv
0+阅读 · 2020年11月27日
Arxiv
0+阅读 · 2020年11月27日
Arxiv
4+阅读 · 2018年3月14日
Arxiv
6+阅读 · 2017年12月2日
VIP会员
相关资讯
【NLP】NLP未来发展趋势&ACL 2019回顾
产业智能官
5+阅读 · 2019年8月27日
ACL 2019年度回顾:自然语言处理发展趋势
人工智能学家
5+阅读 · 2019年8月19日
5G全产业链发展分析报告
行业研究报告
11+阅读 · 2019年6月7日
2019中国家政服务行业发展剖析及行业投资机遇分析报告
中国高速铁路信息化现状及智能化发展
科技导报
10+阅读 · 2019年4月19日
深度|拥抱人工智能报告:中国未来就业的挑战与应对
机器人大讲堂
6+阅读 · 2018年9月24日
《中国人工智能发展报告2018》(附PDF下载)
走向智能论坛
19+阅读 · 2018年7月17日
2018-2020年中国服务机器人行业深度研究报告
机器人大讲堂
5+阅读 · 2018年1月30日
相关论文
Arxiv
1+阅读 · 2020年12月3日
Arxiv
0+阅读 · 2020年12月3日
Arxiv
0+阅读 · 2020年11月27日
Arxiv
0+阅读 · 2020年11月27日
Arxiv
4+阅读 · 2018年3月14日
Arxiv
6+阅读 · 2017年12月2日
Top
微信扫码咨询专知VIP会员