项目名称: 汉语复杂网络的性质、结构、演化及其典型应用研究
项目编号: No.60873174
项目类型: 面上项目
立项/批准年度: 2009
项目学科: 生物科学
项目作者: 孙茂松
作者单位: 清华大学
项目金额: 32万元
中文摘要: 从复杂网络这一崭新的视角对汉语进行系统的探索,无论是对汉语本体研究还是对中文信息处理,都具有方法论意义上的创新性,并且涉及复杂系统、语言学、自然语言处理、机器学习、统计学等多学科的交叉,因此具有十分重要的科学意义,已成为当前自然语言处理的研究前沿与热点之一。本项目将主要进行以下几方面研究:利用目前可能得到的一切汉语资源,构造覆盖词法、句法、语义不同层次的各种类型大规模汉语语言网络;对上述语言网络的性质、结构和演化进行分析与对比;提出适合汉语语言网络特点的模体及社区特征发现算法;提出基于不同结构粒度相结合的汉语语义网络演化分析方法;提出基于复杂网络的标签自动生成算法,以进一步研究复杂网络方法在自然语言处理中的典型应用及其相关技术。本项目对汉语语言网络全面、深入的考察与研究, 将大大丰富和深化对汉语的科学认识,得出的一系列结果或结论对汉语语言学、语言认知、中文信息处理等均具有重要参考价值。
中文关键词: 复杂网络;汉语语言网络;算法;汉语语言学;中文信息处理
英文摘要:
英文关键词: