Measurement is a fundamental building block of numerous scientific models and their creation. This is in particular true for data driven science. Due to the high complexity and size of modern data sets, the necessity for the development of understandable and efficient scaling methods is at hand. A profound theory for scaling data is scale-measures, as developed in the field of formal concept analysis. Recent developments indicate that the set of all scale-measures for a given data set constitutes a lattice and does hence allow efficient exploring algorithms. In this work we study the properties of said lattice and propose a novel scale-measure exploration algorithm that is based on the well-known and proven attribute exploration approach. Our results motivate multiple applications in scale recommendation, most prominently (semi-)automatic scaling.


翻译:计量是众多科学模型及其创建的基本基石。对于数据驱动的科学来说,尤其如此。由于现代数据集的高度复杂性和规模,发展可理解和高效的缩放方法的必要性即将到来。数据缩放的深刻理论是正式概念分析领域开发的尺度测量方法。最近的事态发展表明,特定数据集的所有尺度测量方法都是一个细小的,因此允许有效探索算法。在这项工作中,我们研究了上述拉蒂斯的特性,并提出了基于众所周知和经证实的属性探索方法的新型比例尺度测量勘探算法。我们的结果激励了在规模建议中的多种应用,最显著的是(半)自动缩放法。

0
下载
关闭预览

相关内容

【干货书】机器学习速查手册,135页pdf
专知会员服务
125+阅读 · 2020年11月20日
【新书】Python数据科学食谱(Python Data Science Cookbook)
专知会员服务
114+阅读 · 2020年1月1日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
【新书】Python编程基础,669页pdf
专知会员服务
194+阅读 · 2019年10月10日
机器学习入门的经验与建议
专知会员服务
92+阅读 · 2019年10月10日
已删除
生物探索
3+阅读 · 2018年2月10日
【推荐】免费书(草稿):数据科学的数学基础
机器学习研究会
20+阅读 · 2017年10月1日
Arxiv
0+阅读 · 2021年3月28日
Principal Neighbourhood Aggregation for Graph Nets
Arxiv
17+阅读 · 2020年6月7日
Meta-Learning to Cluster
Arxiv
17+阅读 · 2019年10月30日
Arxiv
3+阅读 · 2018年2月24日
Arxiv
3+阅读 · 2016年2月24日
Arxiv
6+阅读 · 2016年1月15日
VIP会员
相关资讯
已删除
生物探索
3+阅读 · 2018年2月10日
【推荐】免费书(草稿):数据科学的数学基础
机器学习研究会
20+阅读 · 2017年10月1日
Top
微信扫码咨询专知VIP会员