Event data are prevalent in diverse domains such as financial trading, business workflows and industrial IoT nowadays. An event is often characterized by several attributes denoting the meaning associated with the corresponding occurrence time/duration. From traditional operational systems in enterprises to online systems for Web services, event data is generated from physical world uninterruptedly. However, due to the variety and veracity features of Big data, event data generated from heterogeneous and dirty sources could have very different event representations and data quality issues. In this work, we summarize several typical works on studying data quality issues of event data, including: (1) event matching, (2) event error detection, (3) event data repair, and (4) approximate pattern matching.


翻译:事件数据在金融交易、商业工作流程和工业性IoT等不同领域十分普遍,活动的特点往往是若干属性,说明相应的发生时间/时间的相关含义。从企业的传统操作系统到网上网络服务系统,事件数据都是不间断地从实体世界生成的。然而,由于大数据的多样性和真实性特点,来自不同和肮脏来源的事件数据可能会有非常不同的事件表现和数据质量问题。在这项工作中,我们总结了研究事件数据数据质量问题的一些典型工作,包括:(1)事件匹配,(2)事件错误检测,(3)事件数据修复,(4)大致模式匹配。

1
下载
关闭预览

相关内容

机器学习模型安全与隐私研究综述
专知会员服务
111+阅读 · 2020年11月12日
数据标注研究综述,软件学报,19页pdf
专知会员服务
89+阅读 · 2020年2月20日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
综述 | 事件抽取及推理 (下)
开放知识图谱
38+阅读 · 2019年1月14日
人工智能 | SCI期刊专刊信息3条
Call4Papers
5+阅读 · 2019年1月10日
综述 | 事件抽取及推理 (上)
开放知识图谱
87+阅读 · 2019年1月9日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
【论文】图上的表示学习综述
机器学习研究会
14+阅读 · 2017年9月24日
【推荐】Python机器学习生态圈(Scikit-Learn相关项目)
机器学习研究会
6+阅读 · 2017年8月23日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Arxiv
2+阅读 · 2021年2月15日
Arxiv
126+阅读 · 2020年9月6日
Arxiv
35+阅读 · 2019年11月7日
AutoML: A Survey of the State-of-the-Art
Arxiv
69+阅读 · 2019年8月14日
Learning From Positive and Unlabeled Data: A Survey
Arxiv
5+阅读 · 2018年11月12日
Arxiv
5+阅读 · 2017年4月12日
VIP会员
相关资讯
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
综述 | 事件抽取及推理 (下)
开放知识图谱
38+阅读 · 2019年1月14日
人工智能 | SCI期刊专刊信息3条
Call4Papers
5+阅读 · 2019年1月10日
综述 | 事件抽取及推理 (上)
开放知识图谱
87+阅读 · 2019年1月9日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
【论文】图上的表示学习综述
机器学习研究会
14+阅读 · 2017年9月24日
【推荐】Python机器学习生态圈(Scikit-Learn相关项目)
机器学习研究会
6+阅读 · 2017年8月23日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
相关论文
Arxiv
2+阅读 · 2021年2月15日
Arxiv
126+阅读 · 2020年9月6日
Arxiv
35+阅读 · 2019年11月7日
AutoML: A Survey of the State-of-the-Art
Arxiv
69+阅读 · 2019年8月14日
Learning From Positive and Unlabeled Data: A Survey
Arxiv
5+阅读 · 2018年11月12日
Arxiv
5+阅读 · 2017年4月12日
Top
微信扫码咨询专知VIP会员