【KDD2019|讲座推荐】现代MDL与数据挖掘的结合--洞察力、理论和实践：Modern MDL meets Data Mining -- Insights, Theory, and Practice - 专知VIP

会员服务 ·

2

Jilles Vreeken · 数据挖掘 · 机器学习 · 深度学习 · AI ·

2019 年 12 月 9 日

【KDD2019|讲座推荐】现代MDL与数据挖掘的结合--洞察力、理论和实践：Modern MDL meets Data Mining -- Insights, Theory, and Practice

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

讲座题目

现代MDL与数据挖掘的结合--洞察力、理论和实践：Modern MDL meets Data Mining -- Insights, Theory, and Practice

讲座简介

当考虑一个数据集时，通常不知道它是如何的，因此描述或捕获其主要特征的模型应该有多复杂。通常，这些选择会被掩盖、忽略，交给领域专家处理，但在实践中，这是非常不令人满意的；领域专家不知道如何设置$k$，在选择之前选择什么，或者有多少自由度比我们做的更理想。最小描述长度（MDL）原理能够从清晰直观的角度回答模型选择问题。简而言之，它断言最好的模型是同时压缩数据和模型的模型。在本教程中，我们不仅介绍了模型选择的基本知识，展示了基于MDL的建模的重要特性、成功的例子以及如何应用MDL解决数据挖掘问题的陷阱，还介绍了现代MDL中重要新概念的高级主题（例如，归一化最大似然（NML）、顺序NML、分解NML和MDL变化统计）和动态设置中的新兴应用。在本教程中，我们的目标是确保读者不仅掌握基本理论，而且了解如何将其付诸实践。

讲座嘉宾

Jilles Vreeken ，在赫尔姆霍兹信息安全中心领导探索性数据分析研究小组。此外，是马克斯·普朗克信息学研究所数据库和信息系统组（D5）的高级研究员，萨尔兰大学计算机科学系的教授。研究主要涉及数据挖掘和机器学习。特别是，喜欢开发理论和算法来回答关于数据的探索性问题，例如“我的数据中的因果依赖关系是什么”或“这是我的数据，告诉我需要知道什么”。为了确定什么是有价值的结构，经常采用基于信息论的有根据的统计方法。在此基础上，可以开发出高效的算法，从大量复杂的数据中提取有用的、有见地的结果。

成为VIP会员查看完整内容

17

相关内容

Jilles Vreeken

Jilles Vreeken ，在赫尔姆霍兹信息安全中心领导探索性数据分析研究小组。此外，是马克斯·普朗克信息学研究所数据库和信息系统组（D5）的高级研究员，萨尔兰大学计算机科学系的教授。研究主要涉及数据挖掘和机器学习。特别是，喜欢开发理论和算法来回答关于数据的探索性问题，例如“我的数据中的因果依赖关系是什么”或“这是我的数据，告诉我需要知道什么”。为了确定什么是有价值的结构，经常采用基于信息论的有根据的统计方法。在此基础上，可以开发出高效的算法，从大量复杂的数据中提取有用的、有见地的结果。

【CMU-Amazon】时间序列预测：理论与实践，379页ppt阐述大规模时序预测工具与方法

【CMU-Amazon】时间序列预测：理论与实践，379页ppt阐述大规模时序预测工具与方法

专知会员服务

234+阅读 · 2020年4月24日

【硬核书】数学博弈论与应用，431页pdf，Mathematical Game Theory and Applications

【硬核书】数学博弈论与应用，431页pdf，Mathematical Game Theory and Applications

专知会员服务

170+阅读 · 2020年4月18日

【干货书】机器学习Python实战教程，366页pdf

【干货书】机器学习Python实战教程，366页pdf

专知会员服务

344+阅读 · 2020年3月17日

【教程推荐】中科大刘淇教授-数据挖掘基础，刘淇

【教程推荐】中科大刘淇教授-数据挖掘基础，刘淇

专知会员服务

82+阅读 · 2020年3月4日

【神经网络数学的初学者指南】（A Beginner’s Guide to the Mathematics of Neural Networks），伦敦国王学院数学系教授| A. C. C. Coolen

【神经网络数学的初学者指南】（A Beginner’s Guide to the Mathematics of Neural Networks），伦敦国王学院数学系教授| A. C. C. Coolen

专知会员服务

55+阅读 · 2019年12月12日

【KDD2019|讲座推荐】从海量文本中构建和挖掘异构信息网络：Constructing and Mining Heterogeneous Information Networks from Massive Text

【KDD2019|讲座推荐】从海量文本中构建和挖掘异构信息网络：Constructing and Mining Heterogeneous Information Networks from Massive Text

专知会员服务

47+阅读 · 2019年12月11日

【KDD2019|讲座推荐】假设检验与统计声音模式挖掘：Hypothesis Testing and Statistically-sound Pattern Mining

【KDD2019|讲座推荐】假设检验与统计声音模式挖掘：Hypothesis Testing and Statistically-sound Pattern Mining

专知会员服务

22+阅读 · 2019年12月6日

【KDD2019|讲座推荐】大时间序列预测的理论与实践：Forecasting Big Time Series: Theory and Practice

【KDD2019|讲座推荐】大时间序列预测的理论与实践：Forecasting Big Time Series: Theory and Practice

专知会员服务

117+阅读 · 2019年12月6日

【MLA 2019】学习因果关系与因果关系学习（Learning Causality and Learning with Causality: A Road to Intelligence）美国卡内基梅隆大学，张坤

【MLA 2019】学习因果关系与因果关系学习（Learning Causality and Learning with Causality: A Road to Intelligence）美国卡内基梅隆大学，张坤

专知会员服务

126+阅读 · 2019年11月16日

【VLDB2019 tutorial】Combating Fake News: A Data Management and Mining Perspective，不列颠哥伦比亚大|Laks V.S. Lakshmanan，Michael Simpson，Sara Thirumuruganathan，156页PDF

【VLDB2019 tutorial】Combating Fake News: A Data Management and Mining Perspective，不列颠哥伦比亚大|Laks V.S. Lakshmanan，Michael Simpson，Sara Thirumuruganathan，156页PDF

专知会员服务

13+阅读 · 2019年8月27日

【CMU-Amazon】时间序列预测：理论与实践，379页ppt阐述大规模时序预测工具与方法

【CMU-Amazon】时间序列预测：理论与实践，379页ppt阐述大规模时序预测工具与方法

专知

31+阅读 · 2020年4月24日

【VLDB2019】虚假新闻（Fake News）检测全面综述教程，156页PPT带你进入这一领域

【VLDB2019】虚假新闻（Fake News）检测全面综述教程，156页PPT带你进入这一领域

专知

87+阅读 · 2019年9月3日

【KDD2019】清华大学《图神经网络-算法、理论和应用》教程

【KDD2019】清华大学《图神经网络-算法、理论和应用》教程

专知

52+阅读 · 2019年8月22日

【KDD2019】时间序列预测：理论与实践教程，300多页PPT带你了解领域最新动态

【KDD2019】时间序列预测：理论与实践教程，300多页PPT带你了解领域最新动态

专知

61+阅读 · 2019年8月7日

机器学习、深度学习算法原理与案例实践暨Python大数据综合应用高级研修班

机器学习、深度学习算法原理与案例实践暨Python大数据综合应用高级研修班

算法与数学之美

8+阅读 · 2018年3月25日

教程 | 理解XGBoost机器学习模型的决策过程

教程 | 理解XGBoost机器学习模型的决策过程

机器之心

6+阅读 · 2017年12月20日

【下载】JAVA程序员深度学习实用指引《Deep Learning: Practical Neural Networks》

【下载】JAVA程序员深度学习实用指引《Deep Learning: Practical Neural Networks》

专知

12+阅读 · 2017年12月7日

干货分享 | 详解特征工程与推荐系统及其实践（附PPT）

干货分享 | 详解特征工程与推荐系统及其实践（附PPT）

量子位

7+阅读 · 2017年11月19日

关于数据挖掘，有几本书推荐给你......

关于数据挖掘，有几本书推荐给你......

图灵教育

16+阅读 · 2017年10月11日

【深度】专知主题链路知识推荐#8-机器学习中的变分推断方法(Variational Inference)简介01

【深度】专知主题链路知识推荐#8-机器学习中的变分推断方法(Variational Inference)简介01

专知

15+阅读 · 2017年9月26日

Adversarial Multimodal Representation Learning for Click-Through Rate Prediction

Arxiv

23+阅读 · 2020年3月7日

A Review on Generative Adversarial Networks: Algorithms, Theory, and Applications

A Review on Generative Adversarial Networks: Algorithms, Theory, and Applications

Arxiv

59+阅读 · 2020年1月20日

Deep Learning for Energy Markets

Deep Learning for Energy Markets

Arxiv

10+阅读 · 2019年4月10日

Adaptive Neural Trees

Adaptive Neural Trees

Arxiv

4+阅读 · 2018年12月10日

Neural source-filter-based waveform model for statistical parametric speech synthesis

Arxiv

4+阅读 · 2018年11月26日

Multitask Learning on Graph Neural Networks - Learning Multiple Graph Centrality Measures with a Unified Network

Arxiv

4+阅读 · 2018年9月11日

Learning from Longitudinal Face Demonstration - Where Tractable Deep Modeling Meets Inverse Reinforcement Learning

Learning from Longitudinal Face Demonstration - Where Tractable Deep Modeling Meets Inverse Reinforcement Learning

Arxiv

3+阅读 · 2018年9月4日

Deep Randomized Ensembles for Metric Learning

Deep Randomized Ensembles for Metric Learning

Arxiv

5+阅读 · 2018年9月4日

Online Deep Metric Learning

Arxiv

8+阅读 · 2018年5月15日

Learning to Evade Static PE Machine Learning Malware Models via Reinforcement Learning

Arxiv

3+阅读 · 2018年1月30日

VIP会员

相关主题

相关VIP内容

【CMU-Amazon】时间序列预测：理论与实践，379页ppt阐述大规模时序预测工具与方法

【CMU-Amazon】时间序列预测：理论与实践，379页ppt阐述大规模时序预测工具与方法

专知会员服务

234+阅读 · 2020年4月24日

【硬核书】数学博弈论与应用，431页pdf，Mathematical Game Theory and Applications

【硬核书】数学博弈论与应用，431页pdf，Mathematical Game Theory and Applications

专知会员服务

170+阅读 · 2020年4月18日

【干货书】机器学习Python实战教程，366页pdf

【干货书】机器学习Python实战教程，366页pdf

专知会员服务

344+阅读 · 2020年3月17日

【教程推荐】中科大刘淇教授-数据挖掘基础，刘淇

【教程推荐】中科大刘淇教授-数据挖掘基础，刘淇

专知会员服务

82+阅读 · 2020年3月4日

【神经网络数学的初学者指南】（A Beginner’s Guide to the Mathematics of Neural Networks），伦敦国王学院数学系教授| A. C. C. Coolen

【神经网络数学的初学者指南】（A Beginner’s Guide to the Mathematics of Neural Networks），伦敦国王学院数学系教授| A. C. C. Coolen

专知会员服务

55+阅读 · 2019年12月12日

【KDD2019|讲座推荐】从海量文本中构建和挖掘异构信息网络：Constructing and Mining Heterogeneous Information Networks from Massive Text

【KDD2019|讲座推荐】从海量文本中构建和挖掘异构信息网络：Constructing and Mining Heterogeneous Information Networks from Massive Text

专知会员服务

47+阅读 · 2019年12月11日

【KDD2019|讲座推荐】假设检验与统计声音模式挖掘：Hypothesis Testing and Statistically-sound Pattern Mining

【KDD2019|讲座推荐】假设检验与统计声音模式挖掘：Hypothesis Testing and Statistically-sound Pattern Mining

专知会员服务

22+阅读 · 2019年12月6日

【KDD2019|讲座推荐】大时间序列预测的理论与实践：Forecasting Big Time Series: Theory and Practice

【KDD2019|讲座推荐】大时间序列预测的理论与实践：Forecasting Big Time Series: Theory and Practice

专知会员服务

117+阅读 · 2019年12月6日

【MLA 2019】学习因果关系与因果关系学习（Learning Causality and Learning with Causality: A Road to Intelligence）美国卡内基梅隆大学，张坤

【MLA 2019】学习因果关系与因果关系学习（Learning Causality and Learning with Causality: A Road to Intelligence）美国卡内基梅隆大学，张坤

专知会员服务

126+阅读 · 2019年11月16日

【VLDB2019 tutorial】Combating Fake News: A Data Management and Mining Perspective，不列颠哥伦比亚大|Laks V.S. Lakshmanan，Michael Simpson，Sara Thirumuruganathan，156页PDF

【VLDB2019 tutorial】Combating Fake News: A Data Management and Mining Perspective，不列颠哥伦比亚大|Laks V.S. Lakshmanan，Michael Simpson，Sara Thirumuruganathan，156页PDF

专知会员服务

13+阅读 · 2019年8月27日

热门VIP内容

开通专知VIP会员享更多权益服务

操作系统智能体：基于多模态大模型（MLLM）的通用计算设备智能体综述

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

自主人工智能：未来战争是否将是自主化的？

相关资讯

【CMU-Amazon】时间序列预测：理论与实践，379页ppt阐述大规模时序预测工具与方法

【CMU-Amazon】时间序列预测：理论与实践，379页ppt阐述大规模时序预测工具与方法

专知

31+阅读 · 2020年4月24日

【VLDB2019】虚假新闻（Fake News）检测全面综述教程，156页PPT带你进入这一领域

【VLDB2019】虚假新闻（Fake News）检测全面综述教程，156页PPT带你进入这一领域

专知

87+阅读 · 2019年9月3日

【KDD2019】清华大学《图神经网络-算法、理论和应用》教程

【KDD2019】清华大学《图神经网络-算法、理论和应用》教程

专知

52+阅读 · 2019年8月22日

【KDD2019】时间序列预测：理论与实践教程，300多页PPT带你了解领域最新动态

【KDD2019】时间序列预测：理论与实践教程，300多页PPT带你了解领域最新动态

专知

61+阅读 · 2019年8月7日

机器学习、深度学习算法原理与案例实践暨Python大数据综合应用高级研修班

机器学习、深度学习算法原理与案例实践暨Python大数据综合应用高级研修班

算法与数学之美

8+阅读 · 2018年3月25日

教程 | 理解XGBoost机器学习模型的决策过程

教程 | 理解XGBoost机器学习模型的决策过程

机器之心

6+阅读 · 2017年12月20日

【下载】JAVA程序员深度学习实用指引《Deep Learning: Practical Neural Networks》

【下载】JAVA程序员深度学习实用指引《Deep Learning: Practical Neural Networks》

专知

12+阅读 · 2017年12月7日

干货分享 | 详解特征工程与推荐系统及其实践（附PPT）

干货分享 | 详解特征工程与推荐系统及其实践（附PPT）

量子位

7+阅读 · 2017年11月19日

关于数据挖掘，有几本书推荐给你......

关于数据挖掘，有几本书推荐给你......

图灵教育

16+阅读 · 2017年10月11日

【深度】专知主题链路知识推荐#8-机器学习中的变分推断方法(Variational Inference)简介01

【深度】专知主题链路知识推荐#8-机器学习中的变分推断方法(Variational Inference)简介01

专知

15+阅读 · 2017年9月26日

相关论文

Adversarial Multimodal Representation Learning for Click-Through Rate Prediction

Arxiv

23+阅读 · 2020年3月7日

A Review on Generative Adversarial Networks: Algorithms, Theory, and Applications

A Review on Generative Adversarial Networks: Algorithms, Theory, and Applications

Arxiv

59+阅读 · 2020年1月20日

Deep Learning for Energy Markets

Deep Learning for Energy Markets

Arxiv

10+阅读 · 2019年4月10日

Adaptive Neural Trees

Adaptive Neural Trees

Arxiv

4+阅读 · 2018年12月10日

Neural source-filter-based waveform model for statistical parametric speech synthesis

Arxiv

4+阅读 · 2018年11月26日

Multitask Learning on Graph Neural Networks - Learning Multiple Graph Centrality Measures with a Unified Network

Arxiv

4+阅读 · 2018年9月11日

Learning from Longitudinal Face Demonstration - Where Tractable Deep Modeling Meets Inverse Reinforcement Learning

Learning from Longitudinal Face Demonstration - Where Tractable Deep Modeling Meets Inverse Reinforcement Learning

Arxiv

3+阅读 · 2018年9月4日

Deep Randomized Ensembles for Metric Learning

Deep Randomized Ensembles for Metric Learning

Arxiv

5+阅读 · 2018年9月4日

Online Deep Metric Learning

Arxiv

8+阅读 · 2018年5月15日

Learning to Evade Static PE Machine Learning Malware Models via Reinforcement Learning

Arxiv

3+阅读 · 2018年1月30日

微信扫码咨询专知VIP会员