项目名称: 维吾尔文WEB舆情挖掘的关键理论及技术研究
项目编号: No.61163033
项目类型: 地区科学基金项目
立项/批准年度: 2012
项目学科: 计算机科学学科
项目作者: 艾斯卡尔·艾木都拉
作者单位: 新疆大学
项目金额: 53万元
中文摘要: 网络己成为公众表达民意、讨论公共事务、公开表述对社会现象的看法、意见、情绪和态度,参与经济社会、政治生活的公共平台以及舆情产生和扩散传播的一个重要空间的今天,如何从海量WEB数据中主动获取热点、焦点话题,分析和理解并从中发现舆情信息,如何及时发现及跟踪舆情热点是当前信息科学和技术领域面临的一大挑战。本课题在中英文的新理论、新方法和新技术的基础上,从维吾尔文语言文字特点出发,围绕网络舆情挖掘所涉及的关键理论和技术,开展维吾尔文WEB信息的采集及处理(WEB数据源获取,WEB页面文本提取及精化,文本编码转换,新老文字转换,分词,词干切分),文本表示(文本特征提取,文本结构化),舆情识别(舆情分类,聚类),舆情分析(舆情观点提取,舆情观点倾向性分析)等4个方面的研究,建立维吾尔文网络舆情信息挖掘的理论体系及技术基础,并通过研发有关算法、工具和试验平台,在相关领域中应用与验证本课题取得的研究成果。
中文关键词: 智能采集;文字转换;语义分词;命名实体识别;情感分析
英文摘要:
英文关键词: intelligent gathering;text conversion;semantic segmentation;named entity recognition;sentiment analyses