【KDD2022教程】在线聚类:算法、评估、指标、应用和基准,附75页ppt

2022 年 8 月 22 日 专知


在线聚类算法在数据科学中发挥着至关重要的作用,尤其是在时间、内存使用和复杂性方面的优势,同时与传统聚类方法相比保持了较高的性能。本教程服务于,首先,作为在线机器学习的调查,特别是数据流聚类方法。在本教程中,最先进的算法和相关的核心研究线程将通过识别不同的类别基于距离,密度网格和隐藏的统计模型。聚类有效性指标作为聚类过程中的一个重要组成部分,通常被忽略或被分类指标所取代,导致对最终结果的误解,也将被深入研究。


然后,本文将介绍River,一个由Creme和scikit-multiflow合并而成的go-to Python库。它也是第一个包含在线集群模块的开源项目,该模块可以促进可重复性,并允许直接进一步改进。在此基础上,我们提出了基于现实问题和数据集的聚类配置、应用程序和基准设置的方法。


https://hoanganhngo610.github.io/river-clustering.kdd.2022/


教程的大纲,如下:


数据流(在线)机器学习导论(约45分钟)

  • 什么是在线机器学习,我们为什么需要在线机器学习?

  • 与批量/传统机器学习相比,在线机器学习的差异、优点和缺点。

  • River简介,一个由Creme和scikit-multiflow合并而成的用于机器学习的实用Python库。

  • River在分类、概念漂移、估计值实现等方面的实际应用,以及使用全视图显示实时结果。


在线聚类算法和评估指标。

  • 综述了现有聚类算法、一般概念及其发展。

  • 聚类和分类评价指标的主要差异,可能导致对最终结果的错误解释。

  • 在线聚类算法和评估指标在实际问题中的实际应用。

用例和基准测试。

  • 在线与传统/批处理聚类算法的比较。

  • 进行基准测试的动机、设置和系统要求。

  • 关于使用River包以及相关的git库和终端进行基准测试的教程。



专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“OC75” 就可以获取【KDD2022教程】在线聚类:算法、评估、指标、应用和基准,附75页ppt》专知下载链接

                       
专知,专业可信的人工智能知识分发 ,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取100000+AI(AI与军事、医药、公安等)主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取100000+AI主题知识资料
登录查看更多
1

相关内容

【KDD2022-教程】深度搜索相关性排名的实践,74页ppt
专知会员服务
22+阅读 · 2022年9月4日
【KDD2022教程】图算法公平性:方法与趋势,200页ppt
专知会员服务
41+阅读 · 2022年8月20日
【KDD2022教程】Transformers多模态数据分类,41页ppt
专知会员服务
84+阅读 · 2022年8月18日
《机器学习的最优传输》教程,63页PPT
专知会员服务
61+阅读 · 2022年4月30日
专知会员服务
75+阅读 · 2021年9月27日
专知会员服务
34+阅读 · 2021年7月19日
【PKDD2020教程】可解释人工智能XAI:算法到应用,200页ppt
专知会员服务
100+阅读 · 2020年10月13日
WSDM 2020教程《深度贝叶斯数据挖掘》,附257页PPT下载
专知会员服务
156+阅读 · 2020年2月7日
【ICML2022】时序自监督视频transformer
专知
1+阅读 · 2022年7月28日
自编码器导论,26页pdf
专知
4+阅读 · 2022年1月18日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
13+阅读 · 2008年12月31日
Arxiv
13+阅读 · 2021年10月22日
Arxiv
57+阅读 · 2021年5月3日
Cold-start Sequential Recommendation via Meta Learner
Arxiv
15+阅读 · 2020年12月10日
已删除
Arxiv
32+阅读 · 2020年3月23日
Arxiv
92+阅读 · 2020年2月28日
VIP会员
相关VIP内容
【KDD2022-教程】深度搜索相关性排名的实践,74页ppt
专知会员服务
22+阅读 · 2022年9月4日
【KDD2022教程】图算法公平性:方法与趋势,200页ppt
专知会员服务
41+阅读 · 2022年8月20日
【KDD2022教程】Transformers多模态数据分类,41页ppt
专知会员服务
84+阅读 · 2022年8月18日
《机器学习的最优传输》教程,63页PPT
专知会员服务
61+阅读 · 2022年4月30日
专知会员服务
75+阅读 · 2021年9月27日
专知会员服务
34+阅读 · 2021年7月19日
【PKDD2020教程】可解释人工智能XAI:算法到应用,200页ppt
专知会员服务
100+阅读 · 2020年10月13日
WSDM 2020教程《深度贝叶斯数据挖掘》,附257页PPT下载
专知会员服务
156+阅读 · 2020年2月7日
相关基金
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
13+阅读 · 2008年12月31日
相关论文
Arxiv
13+阅读 · 2021年10月22日
Arxiv
57+阅读 · 2021年5月3日
Cold-start Sequential Recommendation via Meta Learner
Arxiv
15+阅读 · 2020年12月10日
已删除
Arxiv
32+阅读 · 2020年3月23日
Arxiv
92+阅读 · 2020年2月28日
Top
微信扫码咨询专知VIP会员