中国境内幅员辽阔,地大物博,不同的环境、地质和气候条件孕育了不同的民族,众多少数民族生活在这片960万平方公里的土地上,创造出了灿烂璀璨的文明。语言作为文明的载体和产物,同样在中华大地上落地生根,并开出了五彩斑斓的花朵。
根据历史比较语言学的研究,世界各种语言按照亲属关系被分为不同的语系,世界主要的九大语系有汉藏语系、印欧语系、阿尔泰语系、闪-含语系、乌拉尔语系、南岛语系、南亚语系、达罗毗荼语系和高加索语系。根据1987年中国社会科学院和澳大利亚人文科学院合作编制、由朗文出版(远东)有限公司出版的《中国语言地图集》,中国境内的语言就涵盖了汉藏语系、阿尔泰语系、南岛语系、南亚语系和印欧语系等五大语系,由我国56个民族所使用。
其中,在我国东北延吉地区主要由朝鲜族使用的朝鲜语的归属在语言类型学、历史比较语言学等学术研究中仍存在争议,不属于前述的五大语系。
汉族以及其他少数民族使用的汉语使用比例最高,分布最广,并且方言种类多样,具体分布情况可以参看之前的文章。其他语言主要由各个少数民族使用,其分布与我国境内少数民族的分布高度相关,总的来看,阿尔泰语系的语言主要分布在北方地区,此外北方地区还有部分印欧语系的语言;汉藏语系中的藏缅语族、壮侗语族和苗瑶语族主要分布在南方地区,此外南方地区还有南亚语系、南岛语系中的部分语言,具体分布如下:
内蒙古自治区及东北地区:阿尔泰语系中的蒙古语族和满-通古斯语族语言主要分布在这些地区,如蒙古语、满语、鄂伦春语等。
新疆维吾尔自治区:阿尔泰语系中的突厥语族语言主要分布在该地区,如维吾尔语、哈萨克语等;除此之外,由于新疆地区是连接中亚和东亚的重要地区,因此印欧语系中的部分语言如塔吉克语、俄语等也在分布在新疆部分地区。
西藏自治区:汉藏语系藏缅语族中的藏语主要分布在该地区。
西南地区:汉藏语系藏缅语族、壮侗语族、苗瑶语族中的语言大部分分布在西南地区,如藏缅语族中的傈僳语、纳西语、独龙语、怒语等分布在云南西部,壮侗语族中的壮语主要分布在广西、黎语主要分布在海南、侗语主要分布在贵州、傣语主要分布在云南,苗瑶语族主要分布在云南东南地区。南亚语系主要分布在云南西南地区。
台湾省:南岛语系分布在台湾省。
根据以上分析可以看到,我国境内的语言分布的复杂程度呈现出两个特征。一是边境地区的语言复杂度较高,并且语系跨度大,如云南南部与南亚国家接壤地区,新疆西部与中亚国家接壤地区。二是少数民族分布集中的地方语言复杂度高,如云贵地区等。
以上内容是根据《中国语言地图集》对中国境内语言分布的状况所做的简单梳理,中华文化博大精深,中国境内的语言也奥妙无穷,相信会有越来越多的人去发现、去研究、去探索。
由于微信平台算法改版,公号内容将不再以时间排序展示,如果大家想第一时间看到我们的推送,强烈建议星标我们和给我们多点点【在看】。星标具体步骤为:
(1)点击页面最上方"AINLP",进入公众号主页。
(2)点击右上角的小点点,在弹出页面点击“设为星标”,就可以啦。
感谢支持,比心。
推荐阅读
征稿启示| 200元稿费+5000DBC(价值20个小时GPU算力)
完结撒花!李宏毅老师深度学习与人类语言处理课程视频及课件(附下载)
模型压缩实践系列之——bert-of-theseus,一个非常亲民的bert压缩方法
文本自动摘要任务的“不完全”心得总结番外篇——submodular函数优化
斯坦福大学NLP组Python深度学习自然语言处理工具Stanza试用
关于AINLP
AINLP 是一个有趣有AI的自然语言处理社区,专注于 AI、NLP、机器学习、深度学习、推荐算法等相关技术的分享,主题包括文本摘要、智能问答、聊天机器人、机器翻译、自动生成、知识图谱、预训练模型、推荐系统、计算广告、招聘信息、求职经验分享等,欢迎关注!加技术交流群请添加AINLPer(id:ainlper),备注工作/研究方向+加群目的。
阅读至此了,分享、点赞、在看三选一吧🙏