KDD 2022 已经公布时间检验奖、博士论文奖、创新奖等重磅奖项。
最近几天,一年一度的 KDD 大会正在美国华盛顿特区举办。
本届大会包含 Research 和 Applied Data Science 两个 track。前段时间,大会公布了论文接收结果:Research track 共收到 1695 篇投稿,其中 254 篇被接收,接收率为 14.9%,和去年 Research track(1541 篇投稿,238 篇接收,接收率 15.4%)差别不大;Applied Data Science track 共收到 753 篇投稿,其中 195 篇被接收。
总体来看,大会的接收率为 18.3%(2448 篇投稿,449 篇接收)。
随着会议的进行,各大奖项也开始逐一揭晓,包括时间检验奖、博士论文奖等重磅奖项。其中,斯坦福大学华人博士应智韬获得博士论文奖,清华大学博士裘捷中获得博士论文亚军。华人计算机科学家刘欢教授获得 KDD 创新奖,清华大学助理教授东昱晓获得新星奖。
研究方向的时间检验奖旨在表彰过去十年对数据挖掘研究社区产生重大影响且目前仍被引作新研究分支基础的 KDD 大会杰出论文。今年拿到这一奖项的是加州大学河滨分校 Thanawin Rakthanmanon 等人 2012 年的论文《Searching and Mining Trillions of Time Series Subsequences under Dynamic Time Warping》。
论文地址:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6816304/pdf/nihms-1053769.pdf
大多数时间序列数据挖掘算法都将相似度搜索作为核心子程序,因此相似度搜索所花的时间几乎是所有时间序列数据挖掘算法的瓶颈。将搜索扩展到大型数据集的困难在很大程度上解释了为什么大多数时间序列数据挖掘的学术工作停留在考虑几百万个时间序列对象上,而许多工业和科学领域却有数十亿个时间序列对象等待探索。
在这篇论文中,Thanawin Rakthanmanon 等研究者表明,通过使用四个新的想法的组合,他们可以搜索和挖掘真正大规模的时间序列,这在当时还是首次。他们证明了以下极度反直觉的事实:在大型数据集中,他们可以在 DTW 下精确搜索,比当时的 SOTA 欧几里得距离搜索算法更快。
目前,这篇论文在 Google Scholar 上的引用量是 1050。
袁晶、郑宇、谢幸等人 2012 年的论文《Discovering Regions of Different Functions in a City Using Human Mobility and POls》获得了大会应用数据科学方向的时间检验奖。这几位研究者都来自微软亚洲研究院。
论文地址:http://urban-computing.com/pdf/kdd2012_functional20regions.pdf
如标题所述,这篇论文旨在利用人的流动和地图上的兴趣点(POI,一切可以抽象为点的地理对象)来发现城市中的不同功能区(如教育区、商业区),这一目标通过一个名为 DRoF 的框架来完成。
具体来说,研究者根据主要道路,如高速公路和城市快速路,将一个城市划分为互不相连的区域。他们使用基于主题(topic)的推理模型来推断每个区域的功能,该模型将区域视为文档(document),将功能视为主题,将 POI 的类别(如餐馆和购物中心)视为元数据(如作者、从属关系和关键词),将人的流动模式(当人们到达 / 离开一个地区以及人们从哪里来、去到哪里)视为单词。因此,一个区域可以用一个函数分布来表示,而一个函数则以移动模式的分布为特征。然后,他们进一步确定每个功能在不同位置的强度。
DRoF 框架产生的结果有着广泛的应用价值,包括城市规划、企业选址和社会推荐。研究者使用大规模的真实数据集评估了他们的方法,包括北京的两个 POI 数据集(2010 年和 2011 年)和两个 3 个月的 GPS 轨迹数据集(代表人类出行,分别在 2010 年和 2011 年由 12000 多辆北京出租车生成)。结果证明,他们提出的方法优于仅使用 POI 或人的流动性的基线方法。
目前,这篇论文在 Google Scholar 上的引用量是 1198。
斯坦福大学博士 RexYing(应智韬)的博士论文《Towards Expressive and Scalable Deep Representation Learning for Graphs》拿到了今年的博士论文奖。
论文链接:https://www.proquest.com/openview/43f56ba4da9db357c08883ba102092fa/1?pq-origsite=gscholar&cbl=18750&diss=y
在这篇论文中,应智韬提出了一系列方法,这些方法率先使用图神经网络来解决图表示学习在可解释性、可伸缩性和表达性方面的挑战。论文的第一部分展示了 GraphSAGE 框架,它是一个通用但功能强大的图神经网络框架。第二部分在 GraphSAGE 框架下展示了一系列工作,通过使用层次结构、几何嵌入空间以及 multi-hop 注意力来提高 GNN 的表达能力。最后,他展示了 GNN 在推荐系统、异常检测和物理模拟领域的各种应用。
应智韬于 2022 年 1 月获得斯坦福大学计算机系博士学位,师从斯坦福大学计算机学院副教授、图神经网络大牛 Jure Leskovec(拿到过 KDD 最佳论文奖、时间检验奖等奖项)。目前,应智韬已经加入耶鲁大学担任助理教授,继续研究图神经网络、表示学习、几何深度学习等方向。
除了这篇论文之外,还有两篇论文拿到了最佳论文奖亚军,分别是清华大学博士裘捷中的《Graph Representation Learning: Spectral Theory and Self-supervised Learning》和慕尼黑理工大学博士 Daniel Zügner 的《Graph Representation Learning: Spectral Theory and Self-supervised Learning》。其中,裘捷中的导师是唐杰教授,他本人目前在腾讯担任高级研究员,主要研究方向是图数据的算法设计和表示学习。
KDD 创新奖旨在表彰对数据发现与数据挖掘领域做出杰出贡献,并促进理论和商业系统发展的研究者。
2022 年 KDD 创新奖颁给了华人计算机科学家刘欢教授。获奖理由是「他对社交媒体挖掘和数据挖掘的特征选择的基础、原则以及应用做出了杰出贡献」。
个人主页:https://www.public.asu.edu/~huanliu/
刘欢教授的研究重点是数据挖掘、机器学习和社会计算,致力于设计有效的算法将基础研究转化为实际应用。2018 年,刘欢教授当选 ACM Fellow。
KDD 自 2020 年开始设立新星奖。该奖项根据研究者在博士毕业五年内的工作选出获奖者,旨在促进研究人员规划和建立自己的职业生涯。
今年的 KDD 新星奖颁给了清华大学的东昱晓博士,获奖理由是「他博士毕业五年内在网络数据挖掘和图机器学习领域做出了突出研究」。
个人主页:https://keg.cs.tsinghua.edu.cn/yuxiao/
东昱晓博士现任清华大学计算机系助理教授,主要研究方向为数据挖掘、图机器学习、预训练模型和社交网络。他曾获得 2017 年 ACM SIGKDD 博士论文第三名。
KDD 杰出服务奖旨在表彰在知识发现和数据挖掘领域做出杰出专业服务贡献的个人或团体。
今年的杰出服务奖颁给了 IBM TJ Watson 研究中心的杰出研究人员 Charu Aggarwal,旨在表彰他对数据挖掘领域会议和期刊的杰出服务贡献。
个人主页:http://charuaggarwal.net/
Charu Aggarwal 在数据挖掘领域进行了广泛的工作,研究兴趣包括数据流、隐私、不确定数据和社交网络分析。他出版著作 9 部,发表论文 400 余篇,申请或获得专利 80 余项。他曾获得 2015 年 IEEE ICDM 研究贡献奖和 2019 年 ACM SIGKDD 创新奖,这是数据挖掘领域最具影响力的两个奖项。他还是 W. Wallace McDowell 奖的获得者,这是 IEEE 在计算机科学领域颁发的最高奖项。
掌握「声纹识别技术」:前20小时交给我,后9980小时……
《声纹识别:从理论到编程实战》中文课上线,由谷歌声纹团队负责人王泉博士主讲。
课程视频内容共 12 小时,着重介绍基于深度学习的声纹识别系统,包括大量学术界与产业界的最新研究成果。
同时课程配有 32 次课后测验、10 次编程练习、10 次大作业,确保课程结束时可以亲自上手从零搭建一个完整的声纹识别系统。
课程目前还在
首周优惠中
,欢迎对声纹领域感兴趣的同学一起学习。
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com