预测科学研究热点趋势:微软 · 清华学术画像赛开始了!

2017 年 7 月 30 日 PaperWeekly 小助手


扫描二维码,或点击「原文链接」浏览比赛详情

 

·      组织

联合组织:清华大学、微软、中国人工智能学会、IEEE、Computer Society、中国工程院知识中心、清数大数据产业联盟(微信公众号“TH数据派”:ID:datapi)、华章图书、Paperweekly(微信公众号:Paperweekly) 

全世界有多少科研工作者?

1亿人。

这些学者一共发表了多少篇论文?

3亿篇。

这些论文中,被语义标注的有多少?

只有3%。

 

论文数据囊括了大量的知识,隐含了科技的进步和人类发展的趋势,如果可以更好地利用这些数据,可以更深入地了解人类知识的进展和边界。


最近,微软和清华大学,联合 IEEE 计算机协会、中国工程院知识中心、中国科学院文献情报中心、中国人工智能学会,以及 IEEE 中国代表处等机构。举办「2017 开放学术精准画像大赛」,寻找数据分析高手。比赛从 9 月 18 日正式启动,在 9 月 14 日比赛结束前,你可以随时参赛。


这是研究机构首次开放如此规模的学术标注数据。同时,主办方还准备了约 ¥20 万的总奖金以及来自微软的神秘周冠军礼品。


倘若奖金什么的不足以打动你,那么有机会接触到那么多标注好的学术数据,来分析汇聚人类智慧最前沿的数据吧!听起来是不是有点酷?


下面是比赛的详细介绍。感兴趣的同学,赶紧点击原文链接进入大赛官网报名吧!

·      赛题描述

参赛选手根据学术数据挖掘系统 AMiner.org 和 Microsoft Academic Graph 提供的数据集,提取学者的个人描述信息,分析学者的研究兴趣,以及预测学者的论文引用情况,从而更好地面向学术界提供专家信息、评估学者研究成果、介绍科学研究进展、展示学术发展动态。任务具体描述如下:

任务1: 学者画像信息抽取


学者画像信息具体包括学者的主页地址、性别、职位等。随着互联网越来越普及,与学者相关的网页的数量和内容的丰富度和复杂度都大大增加,其中包含了学者的大量冗余信息,通过整合互联网上多种来源的学者数据,采用合适的机器学习模型,获得学者的精准信息是一项潜在有效的学者画像技术。


任务2: 学者兴趣标签预测


研究兴趣是学者画像的重要组成部分,其不仅是学者本身的研究心得或研究拓展方向的集中体现,也能从中窥视不同背景的学者对研究领域热点或学科研究趋势的关注度、敏感度的集体反映。与学者画像信息抽取类似,通过整合互联网上的大规模多源信息,可以对学者的研究兴趣进行判断。


任务3: 学者未来影响力预测


学术影响力用来衡量学者在专业理论及技术方面的影响,常用的评价指标有论文被引量,期刊影响因子、作者 H 指数等,其中论文被引量是一个重要而直观的指标。本任务的目的是基于学者当前的相关学术数据预测其未来某段时间内的总论文被引量。

·      赛制流程

7 月 18 日:比赛开放提交答案入口

7 月 18 日- 9 月 14 日:比赛期(比赛期间可随时报名和提交

9 月 14 日 23:59 (UTC 时间):发布最终测试集。

9 月 15 日 23:59 (UTC 时间):测试集结果提交截止。

9 月 16 - 20 日:公布比赛最终排名

10 月 15 日(待定):颁奖活动

·      奖项设置

一等奖 1 支队伍,奖金:¥1 万美元(约¥67550)

二等奖 2 支队伍,奖金:各 5000 美元(约¥33750)

三等奖 4 支队伍,奖金:各 2500 美元(约¥16875)

比赛期间所有的周冠军队伍都将获得由微软提供的小礼品,以及由大赛组委会颁发的获奖证书 & 技术图书哦~

·      比赛讨论

您可加入比赛的微信讨论群。加入微信讨论群请添加请添加“数据竞赛小助手”(ID:shujujingsai)为微信好友并在申请时备注“机构+姓名+微软杯”,由小助手统一添加进群。如果备注不正确申请不会被接受

 

·      参赛方式

点阅读原文链接或扫描参赛二维码可直达赛事页面,注册网站 -下载数据,即可参赛。

友情提示,因涉及到数据下载,强烈建议大家登录 PC 页面报名参加~~

大赛页面地址:https://biendata.com/competition/scholar/

登录查看更多
0

相关内容

【清华大学】低资源语言:回顾综述和未来的挑战,14页pdf
基于深度学习的多标签生成研究进展
专知会员服务
143+阅读 · 2020年4月25日
 【中科院信工所】社交媒体情感分析,40页ppt
专知会员服务
102+阅读 · 2019年12月13日
清华大学唐杰老师:用于理解、推理和决策的认知图计算
专知会员服务
120+阅读 · 2019年11月30日
【CCL 2019】2019信息检索趋势,山东大学教授任昭春博士
专知会员服务
30+阅读 · 2019年11月12日
解读《中国新一代人工智能发展报告2019》
走向智能论坛
32+阅读 · 2019年6月5日
2018 年 Top 10 影响力 AI 研究论文
AI科技评论
41+阅读 · 2019年1月6日
预见未来 | 个性化推荐系统,必须关注的五大研究热点
微软研究院AI头条
6+阅读 · 2018年11月29日
哈工大刘挺教授:中文信息处理前沿技术进展
哈工大SCIR
10+阅读 · 2018年11月8日
Kaggle 新赛:第二届 YouTube-8M 视频理解挑战赛
AI研习社
10+阅读 · 2018年5月26日
Arxiv
13+阅读 · 2019年11月14日
Arxiv
11+阅读 · 2018年4月8日
VIP会员
Top
微信扫码咨询专知VIP会员