来参加微软和清华的数据大赛,预测学科发展趋势!更有多重大礼等你拿!
扫描图中二维码,或点击文末“阅读原文”浏览比赛详情
联合组织:清华大学、微软、中国人工智能学会、IEEE Computer Society、中国工程院知识中心、清数大数据产业联盟(微信公众号“TH数据派”:ID:datapi)、华章图书、Paperweekly(微信公众号:Paperweekly)
全世界有多少科研工作者?
1亿人。
这些学者一共发表了多少篇论文?
3亿篇。
这些论文中,被语义标注的有多少?
只有3%。
论文数据囊括了大量的知识,隐含了科技的进步和人类发展的趋势,如果可以更好地利用这些数据,可以更深入地了解人类知识的进展和边界。
最近,微软和清华大学,联合IEEE 计算机协会、中国工程院知识中心、中国科学院文献情报中心、中国人工智能学会,以及IEEE 中国代表处等机构。举办”2017开放学术精准画像大赛“,寻找数据分析高手。比赛从7月18日正式启动,在10月9日比赛结束前,你可以随时参赛。
这是研究机构首次开放如此规模的学术标注数据。同时,主办方还准备了约¥20万的总奖金以及来自微软的神秘周冠军礼品。
倘若奖金什么的不足以打动你,那么有机会接触到那么多标注好的学术数据,来分析汇聚人类智慧最前沿的数据吧!
听起来是不是有点酷?
下面是比赛的详细介绍。感兴趣的同学,赶紧点击文末“阅读原文”进入大赛官网报名吧!
赛题描述:
参赛选手根据学术数据挖掘系统AMiner.org和Microsoft Academic Graph提供的数据集,提取学者的个人描述信息,分析学者的研究兴趣,以及预测学者的论文引用情况,从而更好地面向学术界提供专家信息、评估学者研究成果、介绍科学研究进展、展示学术发展动态。任务具体描述如下:
任务1:学者画像信息抽取
学者画像信息具体包括学者的主页地址、性别、职位等。随着互联网越来越普及,与学者相关的网页的数量和内容的丰富度和复杂度都大大增加,其中包含了学者的大量冗余信息,通过整合互联网上多种来源的学者数据,采用合适的机器学习模型,获得学者的精准信息是一项潜在有效的学者画像技术。
任务2:学者兴趣标签预测
研究兴趣是学者画像的重要组成部分,其不仅是学者本身的研究心得或研究拓展方向的集中体现,也能从中窥视不同背景的学者对研究领域热点或学科研究趋势的关注度、敏感度的集体反映。与学者画像信息抽取类似,通过整合互联网上的大规模多源信息,可以对学者的研究兴趣进行判断。
任务3:学者未来影响力预测
学术影响力用来衡量学者在专业理论及技术方面的影响,常用的评价指标有论文被引量,期刊影响因子、作者H指数等,其中论文被引量是一个重要而直观的指标。本任务的目的是基于学者当前的相关学术数据预测其未来某段时间内的总论文被引量。
赛制流程(北京时间):
9月30日上午7:59 第一阶段结束(本阶段奖金1万美元)
10月8日上午7:59 发布最终测试集
10月9日上午7:59 测试集结果提交截止,第二阶段结束(本阶段奖金3万美元)
奖项设置:
第一阶段:
一等奖1支队伍,奖金3000美元
二等奖2支队伍,奖金各1500美元
三等奖4支队伍,奖金各1000美元
第二阶段:
一等奖1支队伍,奖金1万美元
二等奖2支队伍,奖金各5000美元
三等奖4支队伍,奖金各2500美元
Bonus:截止到月30日上午7:59第一阶段结束,如果你的排名处于前50,就有机会获得由主办方赠出的热门图书《深度学习》一本。
咦,什么叫“有机会呢”?得到赠书,你还需要做如下操作:
1. 转发此条到朋友圈并截图
2. 扫描下方二维码,连同截图和你的收件信息反馈给主办方
然后就可以在十一假期后收到赠书啦!
比赛讨论:
您可加入比赛的微信讨论群。加入微信讨论群请添加请添加“数据竞赛小助手”(ID:shujujingsai)为微信好友并在申请时备注“机构+姓名+微软杯”,由小助手统一添加进群。如果备注不正确申请不会被接受。
参赛方式:
点击文末”阅读原文“或扫描下方二维码可直达赛事页面,注册网站 -下载数据,即可参赛。
友情提示,因涉及到数据下载,强烈建议大家登录 PC 页面报名参加~~
点击“阅读原文”报名