【NeurIPS2023教程】在分布变化下建模与利用数据异质性，128页ppt - 专知VIP

会员服务 ·

24

NeurIPS 2023 · 数据异质性 ·

2023 年 12 月 14 日

【NeurIPS2023教程】在分布变化下建模与利用数据异质性，128页ppt

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

数据异质性是决定机器学习系统性能的关键因素。标准算法优化平均情况性能时，并未考虑数据内部的多样性。因此，数据来源、数据生成机制和子群体的变化导致了不可靠的决策、较差的泛化能力、不公平和错误的科学发现。仔细建模数据异质性是构建可靠数据驱动系统的必要步骤。其严谨的研究是一个新兴研究领域，涵盖了多个学科，包括统计学、因果推断、机器学习、经济学和运筹学。在这个教程中，我们发展了一个统一视角来理解不同社区发展的不同知识脉络。我们旨在通过提供基于共享语言的统一视角来促进跨学科研究。汲取多个独立文献的精华，我们建立了异质性的分类，并介绍了考虑异质性数据的定量度量和学习算法。为了推动实证进展，我们最后讨论了验证协议和基准测试实践。教程：

成为VIP会员查看完整内容

42

相关内容

NeurIPS 2023

【CIKM2023教程】深度聚类算法的应用，94页ppt

【CIKM2023教程】深度聚类算法的应用，94页ppt

专知会员服务

53+阅读 · 2023年11月8日

【RecSys 2023教程】关于离线环境下评估推荐系统的挑战， 51页ppt

【RecSys 2023教程】关于离线环境下评估推荐系统的挑战， 51页ppt

专知会员服务

33+阅读 · 2023年10月11日

【NeurIPS2023】不仅仅是均匀采样：面对不平衡数据集的离线强化学习

【NeurIPS2023】不仅仅是均匀采样：面对不平衡数据集的离线强化学习

专知会员服务

32+阅读 · 2023年10月10日

【干货书】基于模型的强化学习:使用python工具箱从数据到连续动作，275页pdf

【干货书】基于模型的强化学习:使用python工具箱从数据到连续动作，275页pdf

专知会员服务

65+阅读 · 2022年12月21日

【干货书】图数据科学：图算法，分析方法，平台，数据库，和用例，415页pdf

【干货书】图数据科学：图算法，分析方法，平台，数据库，和用例，415页pdf

专知会员服务

79+阅读 · 2022年10月7日

【RecSys22教程】多阶段推荐系统的神经重排序，90页ppt

【RecSys22教程】多阶段推荐系统的神经重排序，90页ppt

专知会员服务

27+阅读 · 2022年9月30日

【KDD2022教程】在线聚类:算法、评估、指标、应用和基准，附75页ppt

【KDD2022教程】在线聚类:算法、评估、指标、应用和基准，附75页ppt

专知会员服务

60+阅读 · 2022年8月22日

【KDD2022教程】图算法公平性：方法与趋势，200页ppt

【KDD2022教程】图算法公平性：方法与趋势，200页ppt

专知会员服务

42+阅读 · 2022年8月20日

【DeepMind】结构化数据少样本学习，51页ppt

【DeepMind】结构化数据少样本学习，51页ppt

专知会员服务

34+阅读 · 2022年8月13日

【IJCAI2022教程】可微分优化:将结构信息集成到训练流程中，173页ppt

【IJCAI2022教程】可微分优化:将结构信息集成到训练流程中，173页ppt

专知会员服务

24+阅读 · 2022年7月29日

【斯坦福博士论文】机器人仿真与控制的组合优化，210页pdf

【斯坦福博士论文】机器人仿真与控制的组合优化，210页pdf

专知

9+阅读 · 2023年4月12日

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

专知

10+阅读 · 2023年4月6日

【斯坦福博士论文】深度学习核编译为局部感知数据流，109页pdf

【斯坦福博士论文】深度学习核编译为局部感知数据流，109页pdf

专知

5+阅读 · 2023年4月5日

干货书《数据融合：理论、方法和应用》289页

干货书《数据融合：理论、方法和应用》289页

专知

8+阅读 · 2023年4月4日

【干货书】实用时间序列分析：使用Python掌握时间序列数据处理、可视化和建模,238页pdf

【干货书】实用时间序列分析：使用Python掌握时间序列数据处理、可视化和建模,238页pdf

专知

30+阅读 · 2022年5月26日

【干货书】高维统计学，572页pdf

【干货书】高维统计学，572页pdf

专知

20+阅读 · 2021年12月3日

【PKDD2020教程】可解释人工智能XAI:算法到应用，200页ppt

【PKDD2020教程】可解释人工智能XAI:算法到应用，200页ppt

专知

16+阅读 · 2020年10月13日

如何建模动态图？看这个《时序图神经网络》视频讲解，26页ppt

如何建模动态图？看这个《时序图神经网络》视频讲解，26页ppt

专知

22+阅读 · 2020年7月25日

【机器学习】深入剖析机器学习中的统计思想

【机器学习】深入剖析机器学习中的统计思想

产业智能官

17+阅读 · 2019年1月24日

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

数据派THU

59+阅读 · 2017年11月6日

基于抽象语义切片和后向求精分析的静态分析警报自动确认研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

29+阅读 · 2015年12月31日

基于草图的几何处理和应用

国家自然科学基金

2+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

面向多源大数据的鲁棒聚类模型与算法研究

国家自然科学基金

6+阅读 · 2015年12月31日

复杂数据下带有形状约束的半参数模型统计推断

国家自然科学基金

3+阅读 · 2014年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

大数据环境下基于GMDH的客户分类半监督集成模型研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向社会化媒体异构大数据的快速组合聚类研究

国家自然科学基金

1+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

174+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

106+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

223+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

86+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

152+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

63+阅读 · 2023年3月29日

Knowledge Graphs: Opportunities and Challenges

Arxiv

179+阅读 · 2023年3月24日

Data-centric Artificial Intelligence: A Survey

Arxiv

25+阅读 · 2023年3月17日

VIP会员

相关主题

数据异质性

相关VIP内容

【CIKM2023教程】深度聚类算法的应用，94页ppt

【CIKM2023教程】深度聚类算法的应用，94页ppt

专知会员服务

53+阅读 · 2023年11月8日

【RecSys 2023教程】关于离线环境下评估推荐系统的挑战， 51页ppt

【RecSys 2023教程】关于离线环境下评估推荐系统的挑战， 51页ppt

专知会员服务

33+阅读 · 2023年10月11日

【NeurIPS2023】不仅仅是均匀采样：面对不平衡数据集的离线强化学习

【NeurIPS2023】不仅仅是均匀采样：面对不平衡数据集的离线强化学习

专知会员服务

32+阅读 · 2023年10月10日

【干货书】基于模型的强化学习:使用python工具箱从数据到连续动作，275页pdf

【干货书】基于模型的强化学习:使用python工具箱从数据到连续动作，275页pdf

专知会员服务

65+阅读 · 2022年12月21日

【干货书】图数据科学：图算法，分析方法，平台，数据库，和用例，415页pdf

【干货书】图数据科学：图算法，分析方法，平台，数据库，和用例，415页pdf

专知会员服务

79+阅读 · 2022年10月7日

【RecSys22教程】多阶段推荐系统的神经重排序，90页ppt

【RecSys22教程】多阶段推荐系统的神经重排序，90页ppt

专知会员服务

27+阅读 · 2022年9月30日

【KDD2022教程】在线聚类:算法、评估、指标、应用和基准，附75页ppt

【KDD2022教程】在线聚类:算法、评估、指标、应用和基准，附75页ppt

专知会员服务

60+阅读 · 2022年8月22日

【KDD2022教程】图算法公平性：方法与趋势，200页ppt

【KDD2022教程】图算法公平性：方法与趋势，200页ppt

专知会员服务

42+阅读 · 2022年8月20日

【DeepMind】结构化数据少样本学习，51页ppt

【DeepMind】结构化数据少样本学习，51页ppt

专知会员服务

34+阅读 · 2022年8月13日

【IJCAI2022教程】可微分优化:将结构信息集成到训练流程中，173页ppt

【IJCAI2022教程】可微分优化:将结构信息集成到训练流程中，173页ppt

专知会员服务

24+阅读 · 2022年7月29日

热门VIP内容

开通专知VIP会员享更多权益服务

《俄乌战争中的无人系统：新的战争方式与新兴趋势——来自前线的印象》报告

《海上自主水面船舶远程操作中心：安全可持续运行的多维度分析》

多模态大语言模型下游调优中“保持自我”的重要性

隐身自主无人水下航行器技术如何变革水下作战并重塑海军竞争

相关资讯

【斯坦福博士论文】机器人仿真与控制的组合优化，210页pdf

【斯坦福博士论文】机器人仿真与控制的组合优化，210页pdf

专知

9+阅读 · 2023年4月12日

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

专知

10+阅读 · 2023年4月6日

【斯坦福博士论文】深度学习核编译为局部感知数据流，109页pdf

【斯坦福博士论文】深度学习核编译为局部感知数据流，109页pdf

专知

5+阅读 · 2023年4月5日

干货书《数据融合：理论、方法和应用》289页

干货书《数据融合：理论、方法和应用》289页

专知

8+阅读 · 2023年4月4日

【干货书】实用时间序列分析：使用Python掌握时间序列数据处理、可视化和建模,238页pdf

【干货书】实用时间序列分析：使用Python掌握时间序列数据处理、可视化和建模,238页pdf

专知

30+阅读 · 2022年5月26日

【干货书】高维统计学，572页pdf

【干货书】高维统计学，572页pdf

专知

20+阅读 · 2021年12月3日

【PKDD2020教程】可解释人工智能XAI:算法到应用，200页ppt

【PKDD2020教程】可解释人工智能XAI:算法到应用，200页ppt

专知

16+阅读 · 2020年10月13日

如何建模动态图？看这个《时序图神经网络》视频讲解，26页ppt

如何建模动态图？看这个《时序图神经网络》视频讲解，26页ppt

专知

22+阅读 · 2020年7月25日

【机器学习】深入剖析机器学习中的统计思想

【机器学习】深入剖析机器学习中的统计思想

产业智能官

17+阅读 · 2019年1月24日

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

数据派THU

59+阅读 · 2017年11月6日

相关基金

基于抽象语义切片和后向求精分析的静态分析警报自动确认研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

29+阅读 · 2015年12月31日

基于草图的几何处理和应用

国家自然科学基金

2+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

面向多源大数据的鲁棒聚类模型与算法研究

国家自然科学基金

6+阅读 · 2015年12月31日

复杂数据下带有形状约束的半参数模型统计推断

国家自然科学基金

3+阅读 · 2014年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

大数据环境下基于GMDH的客户分类半监督集成模型研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向社会化媒体异构大数据的快速组合聚类研究

国家自然科学基金

1+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

174+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

106+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

223+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

86+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

152+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

63+阅读 · 2023年3月29日

Knowledge Graphs: Opportunities and Challenges

Arxiv

179+阅读 · 2023年3月24日

Data-centric Artificial Intelligence: A Survey

Arxiv

25+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员