本文约1102字,建议阅读2分钟
本文介绍
了来自清华大学、南京航空航天大学、香港科技大学的博士生们带来的数据库知识发现专场,11月10日19:30~20:30不见不散。
11月10日 19:30~20:30
AI TIME特别邀请清华大学、南京航空航天大学香港科技大学的博士生,开启KDD第五场!
扫码关注AITIME哔哩哔哩官方账号
观看直播
链接:https://live.bilibili.com/21813994
李之涵:
清华大学计算机系五年级在读博士生,导师为裴丹教授和赵有健教授。主要研究方向包括时序数据异常检测、深度生成模型、智能网络运维等。在包括KDD、WWW、JSAC等顶级会议与期刊发表多篇论文。
使用层次化指标间嵌入及时序嵌入的
多维度时间序列异常检测及异常解释性
内容简介:
异常检测是系统状态监控的重要问题,广泛应用于工业系统及互联网服务等场景中。这些系统状态通常由一组多维度时间序列数据进行刻画。在实际场景下,准确的检测异常并找出一组最异常的时序指标(作为对异常的解释)能有效帮助下游的故障排查和修复工作,因而显得至关重要。在本项工作中,我们提出了一套无监督多维度时间序列异常检测与解释性方法InterFusion来解决上述问题。其核心思想是利用层次化模型同时建模并融合多维度时间序列中的指标间关联依赖及指标内时序依赖,从而刻画多维度时间序列的正常模式来进行异常检测。此外,我们提出一种基于马尔可夫蒙特卡洛的异常解释性方法,通过修正异常段的嵌入(embedding)和重构来寻找最异常的时序指标组合。该方法的效果在工业界多个真实系统的监控数据上得到了验证,在异常检测及异常解释性方面显著超过现有的对比方法。
谢明昆:
南京航空航天大学计算机专业一年级在读博士生,导师为黄圣君教授。主要研究方向为机器学习和数据挖掘,包括弱监督学习,多标记学习等。以第一作者在包括TPAMI, NeurIPS, KDD, AAAI等国际期刊和会议上发表多篇论文。
内容简介:
在偏多标记学习中,每一个示例与一个候选标记集相关,该候选集既包含多个真实标记,也包含其它噪声标记。为了解决偏多标记学习问题,现有方法往往基于对数据结构的额外假设来对候选标记集合进行消歧。然而,在实际任务中,这些假设通常难以成立,导致学得的模型难以泛化到不同的偏多标记分类任务中。本文提出了一种基于元消歧的偏多标记学习方法。与以往工作基于额外假设不同,我们首次引入元学习的方法来对候选标记进行消歧。一方面,通过最小化基于置信度加权的排序损失来学习一个多标记分类器;另一方面,根据候选标记在少量验证集样本上的性能来自适应地估计其置信度。为了提高优化速率,我们提出使用在线优化策略来迭代地更新这两个步骤。在不同数据集上大量的实验证明了提出方法的有效性。