项目名称: 基于生态演替的文本大数据特征学习研究

项目编号: No.61502288

项目类型: 青年科学基金项目

立项/批准年度: 2016

项目学科: 其他

项目作者: 郭鑫

作者单位: 山西大学

项目金额: 20万元

中文摘要: 随着大数据时代的到来,文本数据的快速增长给信息处理和使用带来巨大的挑战,特征选择是机器学习算法的基础,对算法的准确度和效率有着关键性影响。本项目拟从文本大数据出发,基于生态演替理论研究特征学习高效算法,并实现模型的增量动态学习。主要研究内容包括:1.多粒度文本特征建模;2.针对实时数据的文本特征演替模型研究;3.面向篇章级和句子级自动文本特征学习方法研究;4.基于生态演替的文本特征学习实证研究。本项目的研究将为文本挖掘、信息检索领域的机器学习模型提供坚实的理论基础,同时推动文本特征降维研究的发展,为舆情监测、语义分析提供实际应用价值。

中文关键词: 特征学习;生态演替;特征建模;文本大数据

英文摘要: With the arrival of Big Data, the rapid growth of text data poses great challenges for information processing and utilization, feature selection is the basis of machine learning, which has a crucial impact on the accuracy and efficiency of the algorithm. Starting from text big data, this project intends to develop an efficient feature learning algorithm based on ecological succession theory, and to realize incremental dynamic learning for that model. The main research contents include: 1. Multi-granularity text feature modelling; 2. Real time text feature succession modeling; 3. Document-level and sentence-level oriented automatic text feature learning methods; 4. Text feature learning based on empirical research of ecological succession. The research of this project will provide a solid theoretical foundation for text mining, information retrieval and machine learning models, promote the development of text feature dimension reduction research, and provide practical application value for the public opinion monitoring, semantic analysis.

英文关键词: feature learning;ecological succession;feature modeling;text big data

成为VIP会员查看完整内容
1

相关内容

专知会员服务
56+阅读 · 2021年9月18日
专知会员服务
35+阅读 · 2021年8月19日
自动文本摘要研究综述
专知会员服务
68+阅读 · 2021年1月31日
专知会员服务
197+阅读 · 2020年10月14日
专知会员服务
66+阅读 · 2020年9月24日
科技大数据知识图谱构建方法及应用研究综述
专知会员服务
137+阅读 · 2020年8月12日
专知会员服务
221+阅读 · 2020年8月1日
实体关系抽取方法研究综述
专知会员服务
178+阅读 · 2020年7月19日
【ACL2020】基于图神经网络的文本分类新方法
专知会员服务
69+阅读 · 2020年7月12日
深度学习自然语言处理综述,266篇参考文献
专知会员服务
231+阅读 · 2019年10月12日
【博士论文】开放环境下的度量学习研究
专知
7+阅读 · 2021年12月4日
大数据时代的地学知识图谱研究展望
专知
0+阅读 · 2021年11月25日
基于知识图谱的问答系统
PaperWeekly
21+阅读 · 2021年2月8日
基于知识图谱的文本挖掘 - 超越文本挖掘
专知
38+阅读 · 2019年8月18日
用深度学习揭示数据的因果关系
专知
28+阅读 · 2019年5月18日
【知识图谱】知识图谱怎么与深度学习结合?
产业智能官
159+阅读 · 2018年12月18日
深度学习 | 利用词嵌入对文本进行情感分析
沈浩老师
11+阅读 · 2017年10月19日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
21+阅读 · 2020年10月11日
Arxiv
12+阅读 · 2018年1月11日
小贴士
相关VIP内容
专知会员服务
56+阅读 · 2021年9月18日
专知会员服务
35+阅读 · 2021年8月19日
自动文本摘要研究综述
专知会员服务
68+阅读 · 2021年1月31日
专知会员服务
197+阅读 · 2020年10月14日
专知会员服务
66+阅读 · 2020年9月24日
科技大数据知识图谱构建方法及应用研究综述
专知会员服务
137+阅读 · 2020年8月12日
专知会员服务
221+阅读 · 2020年8月1日
实体关系抽取方法研究综述
专知会员服务
178+阅读 · 2020年7月19日
【ACL2020】基于图神经网络的文本分类新方法
专知会员服务
69+阅读 · 2020年7月12日
深度学习自然语言处理综述,266篇参考文献
专知会员服务
231+阅读 · 2019年10月12日
相关资讯
【博士论文】开放环境下的度量学习研究
专知
7+阅读 · 2021年12月4日
大数据时代的地学知识图谱研究展望
专知
0+阅读 · 2021年11月25日
基于知识图谱的问答系统
PaperWeekly
21+阅读 · 2021年2月8日
基于知识图谱的文本挖掘 - 超越文本挖掘
专知
38+阅读 · 2019年8月18日
用深度学习揭示数据的因果关系
专知
28+阅读 · 2019年5月18日
【知识图谱】知识图谱怎么与深度学习结合?
产业智能官
159+阅读 · 2018年12月18日
深度学习 | 利用词嵌入对文本进行情感分析
沈浩老师
11+阅读 · 2017年10月19日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员