项目名称: 基于依存句法分析的蒙古语语义角色标注及关键技术研究
项目编号: No.61262046
项目类型: 地区科学基金项目
立项/批准年度: 2013
项目学科: 自动化技术、计算机技术
项目作者: 华沙宝
作者单位: 内蒙古大学
项目金额: 46万元
中文摘要: 浅层语义分析是当前自然语言理解的研究热点之一,而语义角色标注是浅层语义分析的一种简化形式的实现方式。本课题将在前期研究的基础上,重点解决困扰蒙古语语义角色标注的关键技术问题:如何实现适合与蒙古语固有特征的机器学习方法,如何获取和利用有效的特征信息。主要研究内容包括:1)确定蒙古语语义角色标注体系,这是开展本项研究的基本准则;2)人工建立蒙古语语义角色标注资源,这是进行本项目研究的起点,只有通过这一步,本项目才会获得基本标注语料资源;3)蒙古语语义角色的特征工程,这是本项目的中心研究内容;4)研制蒙古语语义角色自动标注系统,合理构造机器学习方法是研制该系统的关键。
中文关键词: 蒙古语语;语义角色;标注体系;标注资源;自动标注系统
英文摘要: At present, shallow semantic analysis is one of the hot topics in natural language understanding, and semantic role labeling is the simplified realization form of it. In this project,we will mainly solve the key technical problems of Mongolian semantic role labeling on the basis of previous research. Namely,How to design and implement the machine learning method, how to obtain and use the effective feature information. The main research content includes: 1) To determine the annotation scheme for Mongolian semantic role labeling, it is basic rules for the whole research. 2) To establish the resource of Mongolian semantic role labeling system with manual annotation method. It is the starting point. By this step we can obtain the basic reference corpus. 3) Feature engineering of Mongolian semantic roles, this is the main content of the project. 4) To develop an automatic system for Mongolian semantic roles labeling, a reasonable and structural machine learning method is needed when developing it.
英文关键词: Mongolian;semantic roles;system of tagging;semantic role-tagged resources;automatic tagging