The insights revealed from process mining heavily rely on the quality of event logs. Activities extracted from different data sources or the free-text nature within the same system may lead to inconsistent labels. Such inconsistency would then lead to redundancy of activity labels, which refer to labels that have different syntax but share the same behaviours. The identifications of these labels from data-driven process discovery are difficult and would rely heavily on human intervention. In this paper, we propose an approach to detect redundant activity labels using control-flow relations and data values from event logs. We have evaluated our approach using two publicly available logs and also a case study using the MIMIC-III data set. The results demonstrate that our approach can detect redundant activity labels even with low occurrence frequencies. This approach can value-add to the preprocessing step to generate more representative event logs for process mining tasks.


翻译:从开采过程中发现的洞察力在很大程度上取决于事件日志的质量。从不同数据来源或同一系统内的自由文本性质中提取的活动可能会导致标签不一致。这种不一致会导致活动标签的冗余,这些标签是指具有不同语法但具有相同行为的标签。数据驱动过程发现中的这些标签很难识别,而且将严重依赖人类的干预。在本文件中,我们建议采用一种方法,利用控制-流量关系和事件日志的数据值来探测多余的活动标签。我们用两种公开的日志评估了我们的方法,并使用MIMIC-III数据集进行了案例研究。结果表明,即使发生频率低,我们的方法也能探测到重复的活动标签。这种方法可以增值到处理前的步骤,为处理采矿任务生成更具代表性的事件日志。

0
下载
关闭预览

相关内容

专知会员服务
13+阅读 · 2021年3月13日
【ICML2020】多视角对比图表示学习,Contrastive Multi-View GRL
专知会员服务
80+阅读 · 2020年6月11日
因果图,Causal Graphs,52页ppt
专知会员服务
249+阅读 · 2020年4月19日
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
已删除
将门创投
5+阅读 · 2019年10月29日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
DPOD: Dense 6D Pose Object Detector in RGB images
Arxiv
5+阅读 · 2019年2月28日
Arxiv
4+阅读 · 2019年1月14日
VIP会员
相关资讯
已删除
将门创投
5+阅读 · 2019年10月29日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
Top
微信扫码咨询专知VIP会员