讲座题目
从混乱中淘金:稀有类别的探索,展示,表示和解释:Gold Panning from the Mess: Rare Category Exploration, Exposition, Representation and Interpretation
讲座简介
与海量数据形成鲜明对比的是,从在线交易网络中的金融欺诈检测到社交网络中的新兴趋势检测,往往是在许多高影响力领域中非常重要的稀有类别,从社交媒体中的垃圾邮件图像检测到医疗决策支持系统中的罕见疾病诊断。稀有类别分析的独特挑战包括:(1)高度倾斜的类别成员分布;(2)稀有类别与大多数类别的不可分离性;(3)数据和任务的异质性,例如示例的多模态表示,以及跨多个相关任务的相似稀有类别分析。本教程旨在简要回顾复杂稀有类别分析的最新技术,其中大多数类别具有平滑分布,而少数类别在特征空间中具有紧性。特别是,我们从复杂稀有类别分析的背景、问题定义和独特挑战开始;然后,我们全面概述了为这个问题设置而设计的最新进展,从没有任何标签信息的稀有类别探索,到用紧凑的表示方法描述稀有实例的展示步骤,从在显著的嵌入空间中表示稀有模式,到解释预测结果并为最终用户的调查提供相关线索,最后,我们将讨论潜在的复杂稀有范畴分析的挑战与未来发展方向
讲座嘉宾
Dawei Zhou,周大伟目前是伊利诺伊大学香槟分校计算机科学系的博士生。他目前的研究兴趣包括稀有类别分析、主动学习和半监督学习,并应用于金融欺诈检测、社交网络分析。周大伟从事稀有类目分析工作4年,在主要会议(如IJCAI、AAAI、KDD、SDM、ICDM)和期刊(如TKDD、DMKD)上发表了10篇论文。