项目名称: 大数据挖掘在科技项目查重中的应用研究

项目编号: No.71303223

项目类型: 青年科学基金项目

立项/批准年度: 2013

项目学科: 管理科学

项目作者: 李善青

作者单位: 中国科学技术信息研究所

项目金额: 20万元

中文摘要: 科技项目查重是避免重复立项、重复建设的重要手段,然而目前仍然缺乏行之有效的方法。本项目拟采用大数据挖掘理论和方法对与项目相关的多来源信息进行整合,构建准确、稳定的项目相似度判别模型,实现准确、高效的项目查重方法。围绕科技项目的大数据网络是项目查重的数据基础,将分别构建项目信息数据库,文献题录数据库,负责人数据库,承担单位数据库,以及项目与关键词的关联数据库。基于上述理论和数据基础,结合Hadoop技术,实现用于电动汽车领域项目查重的原型实验系统,为后续正式平台的搭建和推广积累经验和奠定基础。本研究工作为解决项目查重问题提供了一种全新的思路和方法,研究结果将是对现有项目查重方法的有益扩展和补充。

中文关键词: 科技项目查重;大数据挖掘;多源信息整合;关键词抽取;Spark框架

英文摘要: Similar project detection is an important way to avoid repeated project and constuction for project management department. however, how to effectively find similar projects is still an unresolved problem. This project will use big data mining theory and t

英文关键词: similar scientific project detection;big data mining;multi-source information integration;keyword extraction;Spark framework

成为VIP会员查看完整内容
0

相关内容

《信息安全技术 云计算服务安全指南》国家标准意见稿
专知会员服务
31+阅读 · 2022年4月14日
专知会员服务
34+阅读 · 2021年10月17日
专知会员服务
62+阅读 · 2021年8月24日
专知会员服务
111+阅读 · 2021年1月8日
应用知识图谱的推荐方法与系统
专知会员服务
115+阅读 · 2020年11月23日
专知会员服务
91+阅读 · 2020年8月7日
知识图谱本体结构构建论文合集
专知会员服务
106+阅读 · 2019年10月9日
重磅:AMiner2022期刊推广方案全面升级
学术头条
0+阅读 · 2022年4月15日
自动化所2项成果荣获北京市科学技术奖一等奖
中国科学院自动化研究所
0+阅读 · 2021年9月27日
哈工大SCIR入选2020年度科研团队公众号Top10
哈工大SCIR
1+阅读 · 2021年5月6日
【北大】知识图谱的关键技术及其智能应用
专知
112+阅读 · 2019年9月19日
Github六个知识图谱实战项目推荐
专知
382+阅读 · 2019年6月2日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Arxiv
0+阅读 · 2022年4月14日
Arxiv
0+阅读 · 2022年4月14日
小贴士
相关VIP内容
相关基金
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
微信扫码咨询专知VIP会员