DRAM failure prediction is a vital task in AIOps, which is crucial to maintain the reliability and sustainable service of large-scale data centers. However, limited work has been done on DRAM failure prediction mainly due to the lack of public available datasets. This paper presents a comprehensive empirical evaluation of diverse machine learning techniques for DRAM failure prediction using a large-scale multi-source dataset, including more than three millions of records of kernel, address, and mcelog data, provided by Alibaba Cloud through PAKDD 2021 competition. Particularly, we first formulate the problem as a multi-class classification task and exhaustively evaluate seven popular/state-of-the-art classifiers on both the individual and multiple data sources. We then formulate the problem as an unsupervised anomaly detection task and evaluate three state-of-the-art anomaly detectors. Further, based on the empirical results and our experience of attending this competition, we discuss major challenges and present future research opportunities in this task.


翻译:在AIOPs, DRAM故障预测是Alibaba Cloud通过PAKDD 2021 竞争提供的300多万份内核、地址和Mcelog数据记录,对维持大型数据中心的可靠性和可持续服务至关重要,但是,在DRAM故障预测方面所做的工作有限,这主要是由于缺少公开的数据集。本文件对使用大型多来源数据集进行DRAM故障预测的各种机器学习技术进行了全面的经验性评价,其中包括Alibaba Cloud通过PAKDD 2021 竞争提供的300多万份内核、地址和Mcelog数据记录。特别是,我们首先将这一问题作为多级分类任务加以阐述,并详尽地评价7个个人和多个数据源的广受欢迎的/最先进的分类人员。然后,我们将这一问题发展成一个不受监督的异常探测任务,并评价3个最先进的异常探测器。此外,根据经验结果和我们参加这一竞争的经验,我们讨论主要的挑战和提出这项任务的未来研究机会。

1
下载
关闭预览

相关内容

亚太知识发现和数据挖掘会议(PAKDD)是数据挖掘和知识发现领域成立时间最长、最具领导地位的国际会议之一。它为研究人员和行业从业者提供了一个国际论坛,以分享他们来自所有KDD相关领域的新思想、原始研究成果和实际开发经验,包括数据挖掘、数据仓库、机器学习、人工智能、数据库、统计、知识工程、可视化、决策系统和新兴应用程序。 官网地址:http://dblp.uni-trier.de/db/conf/pakdd/
多标签学习的新趋势(2020 Survey)
专知会员服务
41+阅读 · 2020年12月6日
2019年机器学习框架回顾
专知会员服务
35+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
无人机视觉挑战赛 | ICCV 2019 Workshop—VisDrone2019
PaperWeekly
7+阅读 · 2019年5月5日
动物脑的好奇心和强化学习的好奇心
CreateAMind
10+阅读 · 2019年1月26日
人工智能 | 国际会议信息10条
Call4Papers
5+阅读 · 2018年12月18日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
计算机类 | 期刊专刊截稿信息9条
Call4Papers
4+阅读 · 2018年1月26日
【推荐】自动特征工程开源框架
机器学习研究会
17+阅读 · 2017年11月7日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
【今日新增】IEEE Trans.专刊截稿信息8条
Call4Papers
7+阅读 · 2017年6月29日
Arxiv
6+阅读 · 2018年6月18日
Arxiv
4+阅读 · 2018年4月11日
VIP会员
相关VIP内容
相关资讯
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
无人机视觉挑战赛 | ICCV 2019 Workshop—VisDrone2019
PaperWeekly
7+阅读 · 2019年5月5日
动物脑的好奇心和强化学习的好奇心
CreateAMind
10+阅读 · 2019年1月26日
人工智能 | 国际会议信息10条
Call4Papers
5+阅读 · 2018年12月18日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
计算机类 | 期刊专刊截稿信息9条
Call4Papers
4+阅读 · 2018年1月26日
【推荐】自动特征工程开源框架
机器学习研究会
17+阅读 · 2017年11月7日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
【今日新增】IEEE Trans.专刊截稿信息8条
Call4Papers
7+阅读 · 2017年6月29日
Top
微信扫码咨询专知VIP会员