项目名称: 面向网络舆论的动态本体学习模型研究

项目编号: No.61003100

项目类型: 青年科学基金项目

立项/批准年度: 2011

项目学科: 金属学与金属工艺

项目作者: 郑海涛

作者单位: 清华大学

项目金额: 7万元

中文摘要: 网络舆论的语义化分析是网络监督、网络监测、网络知识发现、网络行为分析等应用的重要基础。而本体是对领域的概念及其语义关系的一个规范描述,能够很好的表示特定领域的语义信息。本项目通过建立动态本体学习的模型对网络舆论进行语义化分析。本体学习是信息提取的一个分支,目的是从一系列的领域数据集中,自动或者半自动的提取关键概念及其语义关系来构建一个本体。首先,针对网络舆论的时间特征,定义了本体中概念,关系,以及实例的时间属性;其次,建立了关键概念的动态提取模型,通过对支持向量机,人工神经网,贝叶斯学习,归纳学习,以及强化学习等五种机器学习方法的深入分析,采用迁移学习的机制对不同时间点的网络舆论的关键概念进行了提取;然后,基于提取的关键概念,建立了语义关系的计算模型,基于规范信息距离衡量了概念之间的Kolmogorov 复杂性,从而估算了概念之间的语义距离,构建了面向网络舆论的本体;最后,通过大规模真实数据集来验证了该模型合理性和完备性。

中文关键词: 网络舆论;本体学习;迁移学习;规范信息距离

英文摘要: Semantic analysis of public opinion is an important cornerstone for network monitoring, web knowledge discovery, and web behavior analysis. Ontology is a formal description for concepts and their semantic relations in a specific domain. This project aims at semantic analyzing public opinion by constructing a dynamic ontology learning model. Ontology learning is a branch of information extraction, which focuses on extracting key concepts and their semantic relations to construct an ontology automatically or semi-automatically. First, we define the time attribute for concepts, relations, and instances in the ontology based on the feature of public opinion; Second, we construct a dynamic keyword extraction model. We analyze five machine learning algorithms, i.e., support vector machine, artificial neural network, Bayesian learning, inductive learning, and reinforcement learning. Transfer learning is utilized to extract key concepts at different time points of public opinion; Third, we construct the model to compute the semantic relations between extracted key concepts. The model uses normalized information distance to calculate the Kolmogorov complexity between concepts. Finally, we use a large-scale real dataset to evaluate the completeness and the soundness of the proposed model.

英文关键词: Public Opinion; Ontology Learning; Transfer learning; Normalized Information Distance

成为VIP会员查看完整内容
4

相关内容

【博士论文】多任务学习视觉场景理解,140页pdf
专知会员服务
89+阅读 · 2022年4月5日
面向知识图谱的图嵌入学习研究进展
专知会员服务
60+阅读 · 2021年11月3日
面向知识图谱的知识推理综述
专知会员服务
149+阅读 · 2021年11月1日
专知会员服务
16+阅读 · 2021年7月13日
深度学习模型终端环境自适应方法研究
专知会员服务
33+阅读 · 2020年11月13日
【SIGMOD2020-腾讯】Web规模本体可扩展构建
专知会员服务
29+阅读 · 2020年4月12日
技术动态 | 「知识图谱嵌入技术研究」最新2022综述
开放知识图谱
4+阅读 · 2022年2月8日
基于知识图谱的行业问答系统搭建分几步?
PaperWeekly
2+阅读 · 2021年11月11日
论文浅尝 | 面向开放域的无监督实体对齐
开放知识图谱
1+阅读 · 2021年8月24日
技术动态 | 跨句多元关系抽取
开放知识图谱
50+阅读 · 2019年10月24日
技术动态 | 知识图谱上的实体链接
开放知识图谱
69+阅读 · 2019年9月8日
【知识图谱】医学知识图谱构建技术与研究进展
产业智能官
44+阅读 · 2017年11月16日
医学知识图谱构建技术与研究进展
人工智能学家
17+阅读 · 2017年11月11日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
4+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Memory-Gated Recurrent Networks
Arxiv
12+阅读 · 2020年12月24日
Arxiv
14+阅读 · 2019年11月26日
UNITER: Learning UNiversal Image-TExt Representations
Arxiv
23+阅读 · 2019年9月25日
Arxiv
26+阅读 · 2019年3月5日
dynnode2vec: Scalable Dynamic Network Embedding
Arxiv
14+阅读 · 2018年12月6日
Arxiv
10+阅读 · 2017年7月4日
小贴士
相关VIP内容
【博士论文】多任务学习视觉场景理解,140页pdf
专知会员服务
89+阅读 · 2022年4月5日
面向知识图谱的图嵌入学习研究进展
专知会员服务
60+阅读 · 2021年11月3日
面向知识图谱的知识推理综述
专知会员服务
149+阅读 · 2021年11月1日
专知会员服务
16+阅读 · 2021年7月13日
深度学习模型终端环境自适应方法研究
专知会员服务
33+阅读 · 2020年11月13日
【SIGMOD2020-腾讯】Web规模本体可扩展构建
专知会员服务
29+阅读 · 2020年4月12日
相关资讯
技术动态 | 「知识图谱嵌入技术研究」最新2022综述
开放知识图谱
4+阅读 · 2022年2月8日
基于知识图谱的行业问答系统搭建分几步?
PaperWeekly
2+阅读 · 2021年11月11日
论文浅尝 | 面向开放域的无监督实体对齐
开放知识图谱
1+阅读 · 2021年8月24日
技术动态 | 跨句多元关系抽取
开放知识图谱
50+阅读 · 2019年10月24日
技术动态 | 知识图谱上的实体链接
开放知识图谱
69+阅读 · 2019年9月8日
【知识图谱】医学知识图谱构建技术与研究进展
产业智能官
44+阅读 · 2017年11月16日
医学知识图谱构建技术与研究进展
人工智能学家
17+阅读 · 2017年11月11日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
4+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
相关论文
Memory-Gated Recurrent Networks
Arxiv
12+阅读 · 2020年12月24日
Arxiv
14+阅读 · 2019年11月26日
UNITER: Learning UNiversal Image-TExt Representations
Arxiv
23+阅读 · 2019年9月25日
Arxiv
26+阅读 · 2019年3月5日
dynnode2vec: Scalable Dynamic Network Embedding
Arxiv
14+阅读 · 2018年12月6日
Arxiv
10+阅读 · 2017年7月4日
微信扫码咨询专知VIP会员