项目名称: 细颗粒度维吾尔语文本意见挖掘方法的研究

项目编号: No.61262064

项目类型: 地区科学基金项目

立项/批准年度: 2013

项目学科: 自动化技术、计算机技术

项目作者: 禹龙

作者单位: 新疆大学

项目金额: 45万元

中文摘要: 本项目以互联网上的维吾尔语网络文本为研究对象,以计算语言学和人工智能理论为基础,紧密结合维吾尔语语言规律,建立维吾尔语意见型文本语料库的构建规范,创建维吾尔语意见型文本语料库;提出并实现适合于维吾尔语意见型文本的细颗粒度意见挖掘方法;所采用的研究方法将发挥统计和自然语言处理方法的综合优势,以达到最大程度地挖掘可用的细颗粒度信息和知识的目的。本项研究在国内外阿勒泰语系中首次研究细颗粒度维吾尔语文本意见挖掘方法,具有一定的特殊性和创新性,弥补我国少数民族语言信息处理研究的空白,有着重大国内外影响和意义,是目前亟待解决的重大课题。研究成果不仅可以提供给其它自然语言处理系统(应用)使用,如文本分类、自动摘要、问答系统、机器翻译等;还可应用于许多日常生活的领域,如电子商务、商业智能、信息监控、民意调查、电子学习、报刊编辑、企业管理等,为维吾尔语语言信息处理研究打下扎实的理论和实践基础。

中文关键词: 意见挖掘;意见型文本语料库;称述定界;比较关系抽取;细颗粒度

英文摘要: This project regards Uyghur web texts as the research object. Our research methods are based on the theory of computational linguistics and artificial intelligence, closely combine the language laws of Uyghur, construct the construction standard of corpus for Uyghur opinioned texts, establish corpus for Uyghur opinioned texts. This project proposes and realizes the fine-grained opinion mining methods which are suitable for Uyghur opinioned texts. Our research methods will develop the comprehensive advantages of statistics and natural language processing methods, in order to achieve the purpose of mining the available fine-grained information and knowledge to a maximum extent. This project studies the fine-grained opinion mining methods for the first time in the Altaic family at home and abroad. It has a certain degree of particularity and innovation, and can fill in the gaps of minority language information processing research in our country. This project will make an important influence and significance at home and abroad, and it is a great subject to be solved. The research results can provide applications for other natural language processing systems, such as text categorization, automatic summarization, question answering system, machine translation, etc. Our research can be widely applied to many areas of o

英文关键词: opinion mining;opinioned texts corpus;claim delimitation;comparative relations extraction;fine-grained

成为VIP会员查看完整内容
0

相关内容

顾及时空特征的地理知识图谱构建方法
专知会员服务
53+阅读 · 2022年2月15日
专知会员服务
61+阅读 · 2021年8月4日
专知会员服务
69+阅读 · 2021年5月21日
专知会员服务
37+阅读 · 2021年5月14日
专知会员服务
70+阅读 · 2021年3月27日
专知会员服务
142+阅读 · 2020年9月6日
基于多来源文本的中文医学知识图谱的构建
专知会员服务
52+阅读 · 2020年8月21日
【CVPR2020】多模态社会媒体中危机事件分类
专知会员服务
54+阅读 · 2020年4月18日
赛尔笔记|多模态情感分析语料库调研
哈工大SCIR
4+阅读 · 2021年8月13日
基于知识图谱的文本挖掘 - 超越文本挖掘
专知
38+阅读 · 2019年8月18日
面向新闻媒体的命名实体识别技术
PaperWeekly
18+阅读 · 2019年4月17日
深度学习在金融文本情感分类中的应用
AI前线
36+阅读 · 2019年1月12日
深度学习在情感分析中的应用
CSDN大数据
14+阅读 · 2017年8月22日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
国家自然科学基金
2+阅读 · 2008年12月31日
An Efficient Modern Baseline for FloodNet VQA
Arxiv
0+阅读 · 2022年5月30日
Arxiv
0+阅读 · 2022年5月26日
Arxiv
14+阅读 · 2018年5月15日
小贴士
相关VIP内容
顾及时空特征的地理知识图谱构建方法
专知会员服务
53+阅读 · 2022年2月15日
专知会员服务
61+阅读 · 2021年8月4日
专知会员服务
69+阅读 · 2021年5月21日
专知会员服务
37+阅读 · 2021年5月14日
专知会员服务
70+阅读 · 2021年3月27日
专知会员服务
142+阅读 · 2020年9月6日
基于多来源文本的中文医学知识图谱的构建
专知会员服务
52+阅读 · 2020年8月21日
【CVPR2020】多模态社会媒体中危机事件分类
专知会员服务
54+阅读 · 2020年4月18日
相关资讯
相关基金
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
国家自然科学基金
2+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员