KDD 2020创新奖、时间检验奖等六项大奖出炉!

2020 年 8 月 19 日 AI科技评论

作者 | 陈大鑫

编辑 | 陈彩娴
8月13日 KDD 2020 宣布了2020年ACM SIGKDD创新奖、服务奖、论文奖、新星奖、时间检验研究奖、时间检验应用科学奖等六项大奖的获得者,这些奖项是针对数据科学,机器学习,大数据和计算机科学领域的杰出个人和研究团队而设立的。在8月23日至27日组织的年度会议召开之前,该奖项旨在表彰那些对整个行业产生深远影响的人。
“自从26年前大会成立以来,SIGKDD社区进行研究并在KDD大会上进行了介绍,对学术界和工业界以及数十亿全球公民的生活产生了深远的影响”, ACM SIGKDD主席及西蒙弗雷泽大学计算机科学教授裴健说到。“今天获得表彰的杰出科学家,不仅因为他们在专业领域的进步,而且因为他们对世界的重大贡献而受到认可。”
现AI科技评论把KDD官方Twitter上公布的奖项整理如下:

1

创新奖
Thorsten Joachims,康奈尔大学计算机科学与信息科学教授,美国计算机协会、美国人工智能学会院士,因其在机器学习方面的研究贡献而受到认可,包括在信息检索,支持向量机(SVM)和结构化输出预测方面研究人类偏见的有影响力的工作。  
     
值得注意的是,Joachims开创了从隐式反馈中引出可靠偏好的方法,无偏向学习排名方法和提供公平保证的排名方法。ACM SIGKDD创新奖是知识发现和数据挖掘领域技术卓越的最高荣誉。它授予个人或团体合作者,他们的杰出技术创新极大地影响了该领域的研究和开发方向。
Joachims表示:“我很荣幸获得KDD社区的认可。”  KDD以创新而著称-不仅是学术上的努力,而且着眼于现实世界的影响和社会福利。

Joachims个人主页:

http://www.cs.cornell.edu/people/tj/

值得一提的是,Joachims与他的学生和合作者一起发表过的论文在各大顶会共获得了9项最佳论文奖和4项时间检验奖,其中就包括在今年国际信息检索研究与发展(SIGIR 2020)年会上,Thorsten Joachims团队获得了最佳论文奖:
AI科技评论之前对此篇论文做过专门解读: 《SIGIR 2020最佳论文解读出炉,可缓解排名问题的马太效应?》 ,有兴趣的读者可以移步看看。

2

服务奖
Michael Zeller  ,淡马锡(Temasek)人工智能战略与解决方案负责人,因致力于在ACM SIGKDD担任志愿司库和执行委员会秘书而在该领域做出的杰出贡献而感到荣幸。
         
Zeller在执行董事会任职八年,在策划多个KDD会议中发挥了重要作用。作为执行委员会成员,他特别重视应用人工智能,其使命是促进研究机构与行业组织之间的牢固合作关系,这是KDD社区持续成功的关键。ACM SIGKDD服务奖是该领域所授予服务的最高认可。
Zeller说:“作为ACM SIGKDD的长期会员,我一直对我们的志愿者的贡献印象深刻。如果没有他们对我们使命的奉献和信念,我们将永远无法建立这样一个充满活力的数据科学社区,更不用说年复一年地组织如此规模和质量的会议了。”

个人主页:

https://www.linkedin.com/in/michaelzeller/


3

论文奖
ACM SIGKDD论文奖表彰了研究生在数据科学,机器学习和数据挖掘领域所做的杰出工作。
Rediet Abebe 是加州大学伯克利分校计算机科学系新任助理教授,她的博士论文获得了今年的ACM SIGKDD学位论文奖。
Abebe是第一位入选哈佛研究员学会的女性计算机科学家,并与他人共同创立了社会公益机制设计(MDSG),这是一个多机构倡议,旨在改善历史悠久,服务水平低下的弱势社区的机会。
个人主页:https://www.cs.cornell.edu/~red/
其获奖论文为《Designing Algorithms for Social Good》。
       

论文链接:

https://www.cs.cornell.edu/~red/AbebeDissertation.pdf

论文摘要:
算法和人工智能技术显示出巨大的潜力,可以加深我们对社会经济不平等的理解,并为旨在改善获得机会的干预措施提供信息。针对历史上服务不足的社区的干预措施尤其具有挑战性,因为众所周知劣势和不平等是多方面的难以衡量的,并通过基础结构中的反馈循环加以强化。
虽然这些领域已经取得了长足的进步,从公立学校的席位分配到贫困地图绘制,但仍有许多领域有进一步贡献的重大机会,而且我们有可能开发出统一的框架,将计算机算法应用于改善社会福利。
在这篇论文中,我们发展了算法和计算技术,通过两种干预措施来解决这些问题:一种是分配稀缺的社会资源,另一种是改善获取信息的方式。我们研究了算法、离散优化、机制设计、网络和计算科学等领域的技术如何应对不同形式的不利因素,包括易受收入冲击、社会隔离和获取健康信息方面的差异。我们强调计算机在社会变革中发挥作用的机会。
最后,我们将围绕算法、优化和机制设计的使用,围绕一个新兴研究领域的开放性问题——社会公益机制设计展开讨论。
  • 学位论文奖亚军(runner-up)
加利福尼亚大学圣地亚哥分校的计算机科学助理教授Jingbo Shang以其论文《Constructing and Mining Heterogeneous Information Networks from Massive Text 》获得亚军(runner-up)。

论文链接:

http://hanj.cs.illinois.edu/pdf/kdd19_jshang.pdf

论文摘要:
真实世界的数据主要以非结构化文本的形式存在。数据挖掘研究面临的一个重大挑战是开发有效的、可伸缩的方法,将非结构化文本转化为结构化知识。基于我们的设想,将这些文本转化为结构化的异构信息网络,在这种网络上可以根据用户的需要生成可操作的知识。在本论文中,我们将全面概述此方向的最新研究和开发。
首先,我们介绍了一系列从海量、特定领域的文本语料库构建异构信息网络的有效方法。然后讨论了基于用户需求的文本丰富网络的挖掘方法。具体地说,我们关注于可伸缩的、有效的、弱监督的、与语言无关的方法,这些方法适用于各种文本。我们进一步在真实的数据集(包括新闻文章、科学出版物和产品评论)上演示如何构建信息网络,以及它们如何帮助进一步的探索性分析。

4

新星奖
今年是KDD第一届设立KDD年度新星奖(Rising Star Award),该奖项的设立旨在庆祝SIGKDD社区最聪明的新思想的早期成就以及表彰KDD社区里在博士毕业五年内便获得卓越科研成就的年轻学者。
今年一共有两位学者获得,分别是Danai Koutra(Morris Wellman)和汤继良(Tang Jiliang)。
汤继良教授来自密歇根州立大学数据科学与工程实验室(Data Science and Engineering Laboratory),他的杰出工作包括对表示学习的研究,尤其是图形及其在互联网和社交媒体领域的应用。汤教授获得该荣誉的主要原因在于他在特征学习(尤其是图和图在网络、社交媒体和智能教育上的应用)领域所取得的杰出成就。
个人主页:http://www.cse.msu.edu/~tangjili/ 
另外,AI科技评论很有幸在昨日对汤继良教授进行了专访,并与汤老师交流他的科研故事,希望能为青年学子、尤其是正在迷茫中不知出路的年轻人树立一个榜样: 《汤继良:从小镇走出来的KDD科研新星 | 专访 》
第二位获奖人Danai Koutra(Morris Wellman)在密歇根大学计算机科学与工程系的任助理教授,她在大规模数据挖掘中的研究集中于用于网络汇总和多网络分析的有原则、可解释和可扩展的方法。
         
她利用网络内部数据之间的固有联系,了解世界数据中的未知数据。这些连接自然以网络或图形建模,而网络或图形又跨越了我们生活的方方面面:电子邮件通信网络,用于网络搜索的知识图,社交网络,共同作者图,大脑网络,人工神经网络等。她的工作通过提供简洁明了的网络摘要来利用这些数据的大规模,异质性和复杂性,以此作为一种方式:(a)加快后续分析和仅适用于较小的代表性数据的方法;(b)了解底层流程,并通过消除手动筛选大量数据的负担来为我们的决策提供信息;(c)提供对科学数据的见解,产生新的假设。
个人主页:https://web.eecs.umich.edu/~dkoutra/

5

时间检验研究奖
SIGKDD的时间检验奖表彰了至少已发表十年的杰出KDD论文,这些论文对数据挖掘研究界产生了持久影响,并继续被人们视为新的研究分支的基础。今年,时间检验研究奖( Test of Time Award for Research)获得者是Victor S. Sheng,Foster Provost和Panagiotis Ipeirotis:
获奖论文为2008年同行评审论文:
《Get Another Label? Improving Data Quality and Data Mining Using Multiple, Noisy Labelers 》      

论文链接:

http://crowdsourcing-class.org/readings/downloads/econ/get-another-label.pdf

论文摘要:
本文讨论了当标签不完善时,数据项标签的重复获取问题。我们考察了通过重复标记在数据质量方面的改进(或不足),特别是针对监督归纳的训练标签的改进。随着小任务的外包变得越来越容易,例如通过Rent-A-Coder或亚马逊的Mechanical Turk,通常可以以低成本获得不太专业的标签。使用低成本标记,准备未标记的数据部分可能会比标记成本高很多。
我们提出了增加复杂性的重复标记策略,并给出了几个主要结果:
1、 重复标记可以提高标签质量和模型质量,但并不总是这样。
2、当标签嘈杂时,即使在标签并不特别便宜的传统环境中,重复标签也比单一标签更好。
3、一旦处理未标记数据的成本不是免费的,即使是多次标记所有内容的简单策略也可以带来相当大的优势。
4、反复标记一组精心选择的点通常是可取的,我们提出了一种稳健的技术,可以结合不同的不确定性概念来选择质量应提高的数据点。
底线:结果清楚地表明,当标签不完美时,有选择地收购多个标签是数据挖掘者的一种策略;对于某些标签质量/成本制度,好处是巨大的。

6

时间检验应用科学奖
今年是首届应用科学时间测验奖(Test of Time Award for Applied Science)SIGKDD颁发了该奖项,以表彰在数据科学的实际应用中具有影响力的研究。唐杰、李娟子等人凭借他们在2008年发表的关于学术社会网络挖掘的研究成果获得了该奖。
唐杰目前为清华大学计算机科学与技术系长聘教授,计算机系副主任、清华-工程院知识智能联合实验室主任。
       
获奖论文:《ArnetMiner: Extraction and Mining of Academic Social Networks 》       

论文链接:

https://static.aminer.org/upload/pdf/985/1447/1704/53e9a5afb7602d9702edacce.pdf

论文摘要:
本文讨论了ArnetMiner系统中的几个关键问题,该系统旨在提取和挖掘学术社交网络。
具体而言,该系统侧重于:
1、 从Web上自动提取研究人员的个人资料;
2、 将现有数字图书馆出版数据整合到网络中;
3、 对整个学术网络进行建模;
4、为学术网络提供搜索服务;
到目前为止,已经使用统一的标记方法提取了448470名研究人员的个人资料。我们整合了来自网络数据库的出版物,并提出了一个概率框架来处理名称模糊问题。
此外,我们提出了一个统一的建模方法来同时对论文、作者和出版物的主题方面进行建模。基于建模结果提供了专家检索、人员关联搜索等搜索服务。本文介绍了该系统的体系结构和主要特点。我们还对所提出的方法进行了实证评价。

参考链接:
1. https://twitter.com/kdd_news
2. https://www.prnewswire.com/news-releases/kdd-2020-honors-career-achievements-in-knowledge-discovery-and-data-mining-301111583.html?tc=eml_cleartime


阅读原文,直达“ KDD”小组,了解更多会议信息!
登录查看更多
1

相关内容

近期必读的六篇 ICLR 2021【推荐系统】相关投稿论文
专知会员服务
46+阅读 · 2020年10月13日
ECCV 2020 五项大奖出炉!普林斯顿邓嘉获最佳论文奖
专知会员服务
17+阅读 · 2020年8月25日
【快讯】KDD2020论文出炉,216篇上榜, 你的paper中了吗?
专知会员服务
50+阅读 · 2020年5月16日
【快讯】CVPR2020结果出炉,1470篇上榜, 你的paper中了吗?
ECCV 2020接受论文出炉,1361篇都在这了
专知
23+阅读 · 2020年7月4日
KDD 2019放榜,接收率低至14%,你的论文中了吗?
机器之心
7+阅读 · 2019年4月30日
KDD 2017奖项全公布,华人成最大赢家
AI科技评论
9+阅读 · 2017年8月15日
Arxiv
22+阅读 · 2019年11月24日
Sparse Sequence-to-Sequence Models
Arxiv
5+阅读 · 2019年5月14日
Arxiv
9+阅读 · 2018年3月28日
VIP会员
Top
微信扫码咨询专知VIP会员