讲座题目
假设检验与统计声音模式挖掘:Hypothesis Testing and Statistically-sound Pattern Mining
讲座简介
大量数据集的可用性突出表明,需要计算效率高、统计上可靠的方法来提取模式,同时对结果的质量提供严格的保证,特别是在错误发现方面。在本教程中,我们将介绍最近的一些方法,这些方法适当地结合了计算和统计方面的考虑,以便有效地从大型数据集中挖掘统计上可靠的模式。我们首先介绍统计假设检验中的基本概念,数据挖掘社区中的每个人可能都不熟悉这些概念。然后,我们将解释如何以不同的方式处理模式挖掘中的计算和统计挑战。最后,我们描述了这些方法在市场篮分析、子图挖掘、社会网络分析和癌症基因组学等领域的应用。本教程的目的是向观众介绍统计假设测试,强调正确平衡模式挖掘的计算和统计方面的重要性,强调这样做对数据挖掘研究人员的有用性,并鼓励在这方面的进一步研究。
讲座嘉宾
Leonardo Pellegrina是帕多瓦大学信息工程系信息工程专业的博士生,由法比奥·范丁教授和布朗大学客座研究员指导。他的研究活动集中在高效和统计上合理的算法,用于从大数据中发现模式,并应用到计算生物学。