讲座题目

大规模序贯实验的基础:Foundations of large-scale sequential experimentation

讲座简介

大规模序贯假设检验(A/B-testing)在科技行业十分盛行,互联网公司每年要进行数十万次检验。大约6年前,微软声称在Bing上进行的此类实验增加了数亿美元的收入(Kohavi等人,2013年),甚至9年前,谷歌也声称此类实验基本上是一个咒语(Tang等人,2010年)。这个实验实际上是“双重顺序的”,因为它由一系列连续的实验组成。 在本教程中,读者将了解在大规模、异步、双顺序实验中遇到的各种问题,包括内部顺序过程(单个顺序测试)和外部顺序过程(测试顺序),并了解最近开发的解决这些问题的原则。我们将讨论实验内和实验间的误差度量,并介绍可证明控制这些误差的最新方法,无论是否使用参数或渐近假设。特别是,我们将演示当前常见的窥视和边缘测试实践如何无法控制实验内和实验间的错误,但如何通过对实验设置进行简单而微妙的更改来减轻这些错误。我们还将简要讨论多臂bandit方法在检验假设中的作用,以及自适应抽样引入的选择偏差可能带来的陷阱。

讲座嘉宾

Reza Zafarani是锡拉丘兹大学EEC的助理教授。Reza的研究兴趣是社交媒体挖掘、数据挖掘、机器学习和社交网络分析。他的研究重点一直放在应对大规模数据分析的挑战上,以增强大数据的科学发现过程,特别是在社交媒体中。这些挑战包括没有基本事实的评估、快速识别大量数据集中的相关信息、利用有限信息进行学习、大规模用户行为分析和建模,以及跨多个数据源的信息集成和建模。他的研究成果已在各大学术机构发表,并在多家科学机构得到了强调。雷扎是《社交媒体挖掘:导论》一书的主要作者,该书由剑桥大学出版社和SIGKDD探索与传播前沿联合编辑编写。他是亚利桑那州立大学校长创新奖和优秀教学奖的获得者。

成为VIP会员查看完整内容
5

相关内容

Reza Zafarani是锡拉丘兹大学EEC的助理教授。Reza的研究兴趣是社交媒体挖掘、数据挖掘、机器学习和社交网络分析。他的研究重点一直放在应对大规模数据分析的挑战上,以增强大数据的科学发现过程,特别是在社交媒体中。这些挑战包括没有基本事实的评估、快速识别大量数据集中的相关信息、利用有限信息进行学习、大规模用户行为分析和建模,以及跨多个数据源的信息集成和建模。他的研究成果已在各大学术机构发表,并在多家科学机构得到了强调。雷扎是《社交媒体挖掘:导论》一书的主要作者,该书由剑桥大学出版社和SIGKDD探索与传播前沿联合编辑编写。他是亚利桑那州立大学校长创新奖和优秀教学奖的获得者。
【教程推荐】中科大刘淇教授-数据挖掘基础,刘 淇
专知会员服务
78+阅读 · 2020年3月4日
清华大学张敏老师,个性化推荐的基础与趋势,145页ppt
专知会员服务
85+阅读 · 2019年11月27日
推荐系统(一):推荐系统基础
菜鸟的机器学习
25+阅读 · 2019年9月2日
推荐 :如何改善你的训练数据集?(附案例)
数据分析
3+阅读 · 2019年6月19日
R语言时间序列分析
R语言中文社区
12+阅读 · 2018年11月19日
已删除
将门创投
3+阅读 · 2018年8月21日
关于数据挖掘,有几本书推荐给你......
图灵教育
15+阅读 · 2017年10月11日
Arxiv
34+阅读 · 2020年1月2日
Learning Embedding Adaptation for Few-Shot Learning
Arxiv
16+阅读 · 2018年12月10日
VIP会员
相关VIP内容
【教程推荐】中科大刘淇教授-数据挖掘基础,刘 淇
专知会员服务
78+阅读 · 2020年3月4日
清华大学张敏老师,个性化推荐的基础与趋势,145页ppt
专知会员服务
85+阅读 · 2019年11月27日
微信扫码咨询专知VIP会员