项目名称: 汉越双语事件语料库构建及舆情观点挖掘方法研究

项目编号: No.61472168

项目类型: 面上项目

立项/批准年度: 2015

项目学科: 计算机科学学科

项目作者: 余正涛

作者单位: 昆明理工大学

项目金额: 84万元

中文摘要: 及时有效分析互联网越南新闻事件对把握越南事件舆情观点有重要的作用,本课题针对新闻事件及汉越语言特点,研究汉越双语事件本体知识库及语义语料库构建、新闻事件话题发现与追踪、事件舆情观点挖掘方法。首先,定义新闻事件分类体系,构建事件类别术语、事件关系、事件观点等义原类层次树,构建汉越双语事件本体知识库及带语义要素标记的事件语料库,为分析汉越事件提供知识与语料基础。其次,针对汉越双语事件话题产生演化特点,融合双语语言知识、事件本体知识、事件对齐等特征,研究融合双语主题分析和进化聚类的话题发现与追踪方法,解决双语混合事件话题探索与追踪问题;在此基础上,针对事件间及事件内部特征关联特性,融合事件间关联、句子间关联、实体关联及双语关联等特征,研究基于图模型的双语观点句识别、观点分析、持有人分析及倾向性分析方法,解决融合关联特征的双语事件观点挖掘问题。成果将为有效分析汉越双语舆情事件提供资源及技术支撑。

中文关键词: 信息检索;跨语言信息检索;舆情分析;话题分析;观点挖掘

英文摘要: Analyzing Vietnamese web news events timely and effectively plays a crucial role on getting the public opinion of Vietnamese news event.Aiming to the featues of news events and the different linguistic features between Chinese and Vietnamese, this project studies the construction of the Chinese-Vietnamese bilingual event ontology knowledge-base and the bilingual event semantic element corpus, the method of news events topic detection and tracking, and the method of events public opinion mining.Firstly,defining the types of news events,building the hierarchical tree for sememes,such as eventual type terminology,eventual relationship, eventual opinion and so on,and constructing the Chinese-Vietnamese bilingual event ontology knowledge-base and the event corpus with semantic element tag,lay a solid fundation in knowledge and corpus for analyzing Chinese-Vietamese events.Secondly, aiming to the emerging and evolving characters of the Chinese-Vietamese bilingual event topic,combining all kinds of features together,such as the bilingual languange knowledge,event ontology knowledge,event element aligning and so on,the task studies the methods of topic detection and tracking by combining biligual topic analysis and evolving cluster,and resovles the topic detection and tracking problems on the bilingual mixed events.On the basis of the above-mentioned,aiming to the relevant features between events and between the internal characters in event itself,by combining some relevant features together,for example, the relationship between events, the relationship between sentences, the relationship betweens event entities, the relationship between Chinsese and Vietamese etc.,the task also researches on the bilingual opinion sentence recognition,opinion analysis,opinion-holder recognition and opinion sentiment analysis based on graphical model,and solves the bilingual event opinion mining problems by combining these relevant features.The research achivements will support the effective analysis of Chinese-Vietamese bilingual events with corpus and technology.

英文关键词: information retrieval;cross-language information retrieval;public opinion;topic analysis;opinion mining

成为VIP会员查看完整内容
2

相关内容

信息检索( Information Retrieval )指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。信息检索的目标:准确、及时、全面的获取所需信息。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
专知会员服务
20+阅读 · 2021年7月19日
专知会员服务
36+阅读 · 2021年5月29日
专知会员服务
79+阅读 · 2021年5月27日
【AAAI2021】以事件为中心的自然语言理解,256页ppt
专知会员服务
73+阅读 · 2021年2月8日
实体关系抽取方法研究综述
专知会员服务
176+阅读 · 2020年7月19日
【SIGMOD2020-腾讯】Web规模本体可扩展构建
专知会员服务
29+阅读 · 2020年4月12日
知识图谱的自动构建
DataFunTalk
55+阅读 · 2019年12月9日
面向新闻媒体的命名实体识别技术
PaperWeekly
18+阅读 · 2019年4月17日
NLP Chinese Corpus:大规模中文自然语言处理语料
PaperWeekly
14+阅读 · 2019年2月18日
一份超全的NLP语料资源集合及其构建现状
七月在线实验室
33+阅读 · 2019年1月16日
语料库构建——自然语言理解的基础
计算机研究与发展
11+阅读 · 2017年8月21日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
6+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
22+阅读 · 2019年11月24日
小贴士
相关VIP内容
专知会员服务
20+阅读 · 2021年7月19日
专知会员服务
36+阅读 · 2021年5月29日
专知会员服务
79+阅读 · 2021年5月27日
【AAAI2021】以事件为中心的自然语言理解,256页ppt
专知会员服务
73+阅读 · 2021年2月8日
实体关系抽取方法研究综述
专知会员服务
176+阅读 · 2020年7月19日
【SIGMOD2020-腾讯】Web规模本体可扩展构建
专知会员服务
29+阅读 · 2020年4月12日
相关资讯
知识图谱的自动构建
DataFunTalk
55+阅读 · 2019年12月9日
面向新闻媒体的命名实体识别技术
PaperWeekly
18+阅读 · 2019年4月17日
NLP Chinese Corpus:大规模中文自然语言处理语料
PaperWeekly
14+阅读 · 2019年2月18日
一份超全的NLP语料资源集合及其构建现状
七月在线实验室
33+阅读 · 2019年1月16日
语料库构建——自然语言理解的基础
计算机研究与发展
11+阅读 · 2017年8月21日
相关基金
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
6+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员