项目名称: 维吾尔语框架语义角色自动标注技术研究
项目编号: No.61163029
项目类型: 地区科学基金项目
立项/批准年度: 2012
项目学科: 计算机科学学科
项目作者: 阿里甫·库尔班
作者单位: 新疆大学
项目金额: 49万元
中文摘要: 维吾尔语框架语义角色自动标注技术是以真实语料为依据、以维吾尔语框架语义知识库为基础、以先语义后句法为路线,采取条件随机场模型建立维吾尔语框架语义角色标注模型。模型以词为基本标注单元,分别选择词、词性、词相对于目标词的位置、目标词及其组合为特征,针对每个特征设定若干可选的窗口,组合构成模型的各种特征模板,并采用统计正交表的特征模板优选方法,对基于阿拉伯字符的维吾尔语框架语义角色进行自动标注。并以为阶段性目标,进一步研究维吾尔语框架元素的分类体系、标注符号集、语义成分的依存关系、语义角色分解与自动识别技术,语义角色知识库的构建和自动标注等相关技术。最终实现,使计算机对维吾尔语语句有一个"浅层"的理解能力。以此将开展基于阿拉伯字符的维吾尔语框架语义角色基础上的句义理解,语信息检索系统、问答系统和机器翻译系统的研发,通过本项目的研究,使维吾尔语语义分析技术向智能化迈进。
中文关键词: 维吾尔语;框架网络语义知识库;目标词识别;条件随机场;特征
英文摘要:
英文关键词: Uyghur;FrameNet semantic knowledge base;the target word recognition;conditional random fields;feature