High-quality human annotations are necessary for creating effective machine learning-driven stream processing systems. We study hybrid stream processing systems based on a Human-In-The-Loop Machine Learning (HITL-ML) paradigm, in which one or many human annotators and an automatic classifier (trained at least partially by the human annotators) label an incoming stream of instances. This is typical of many near-real-time social media analytics and web applications, including annotating social media posts during emergencies by digital volunteer groups. From a practical perspective, low-quality human annotations result in wrong labels for retraining automated classifiers and indirectly contribute to the creation of inaccurate classifiers. Considering human annotation as a psychological process allows us to address these limitations. We show that human annotation quality is dependent on the ordering of instances shown to annotators and can be improved by local changes in the instance sequence/order provided to the annotators, yielding a more accurate annotation of the stream. We adapt a theoretically-motivated human error framework of mistakes and slips for the human annotation task to study the effect of ordering instances (i.e., an "annotation schedule"). Further, we propose an error-avoidance approach to the active learning paradigm for stream processing applications robust to these likely human errors (in the form of slips) when deciding a human annotation schedule. We support the human error framework using crowdsourcing experiments and evaluate the proposed algorithm against standard baselines for active learning via extensive experimentation on classification tasks of filtering relevant social media posts during natural disasters.


翻译:高质量的人文说明是创建有效的机器学习驱动流处理系统所必需的。 我们研究混合流处理系统,其基础是人文再培训自动分类器(HITL-ML)模式,其中一个或多个人类说明器和一个自动分类器(至少部分由人类说明器培训)标出一连串事件。这是许多近实时社交媒体分析和网络应用程序的典型特征,包括数字志愿人员团体在紧急情况下对社交媒体发布说明。从实际角度看,低质量的人类说明导致为自动分类器重新培训贴上错误标签,间接地帮助创建不准确的分类器。将人类说明作为心理过程,使我们得以解决这些局限性。我们表明,人类说明质量取决于向说明器显示的事件的顺序和顺序的排序,可以通过向说明器提供的地方变化加以改进,从而更准确地说明流流流。我们从理论上对人为错误的分类框架进行了调整,对人文的分类错误进行分类,间接地帮助创建了不准确的分类。 将人类说明作为心理过程的注解,我们用一个积极的逻辑框架来研究排序过程。 我们建议, 一种动态的逻辑的逻辑上的逻辑, 将逻辑上的逻辑上的逻辑上的逻辑上的逻辑, 将逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑,, 用于为人类的逻辑的逻辑的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑,, 用于, 用于, 用于, 用于, 用于为人类的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑上的逻辑

0
下载
关闭预览

相关内容

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集
专知会员服务
164+阅读 · 2020年3月18日
专知会员服务
116+阅读 · 2019年12月24日
机器学习入门的经验与建议
专知会员服务
92+阅读 · 2019年10月10日
IEEE ICKG 2022: Call for Papers
机器学习与推荐算法
3+阅读 · 2022年3月30日
ACM MM 2022 Call for Papers
CCF多媒体专委会
5+阅读 · 2022年3月29日
IEEE TII Call For Papers
CCF多媒体专委会
3+阅读 · 2022年3月24日
ACM TOMM Call for Papers
CCF多媒体专委会
2+阅读 · 2022年3月23日
AIART 2022 Call for Papers
CCF多媒体专委会
1+阅读 · 2022年2月13日
【ICIG2021】Latest News & Announcements of the Workshop
中国图象图形学学会CSIG
0+阅读 · 2021年12月20日
【ICIG2021】Latest News & Announcements of the Plenary Talk2
中国图象图形学学会CSIG
0+阅读 · 2021年11月2日
【ICIG2021】Latest News & Announcements of the Plenary Talk1
中国图象图形学学会CSIG
0+阅读 · 2021年11月1日
【ICIG2021】Latest News & Announcements of the Industry Talk1
中国图象图形学学会CSIG
0+阅读 · 2021年7月28日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
5+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
Arxiv
35+阅读 · 2021年8月2日
Arxiv
18+阅读 · 2019年1月16日
VIP会员
相关资讯
IEEE ICKG 2022: Call for Papers
机器学习与推荐算法
3+阅读 · 2022年3月30日
ACM MM 2022 Call for Papers
CCF多媒体专委会
5+阅读 · 2022年3月29日
IEEE TII Call For Papers
CCF多媒体专委会
3+阅读 · 2022年3月24日
ACM TOMM Call for Papers
CCF多媒体专委会
2+阅读 · 2022年3月23日
AIART 2022 Call for Papers
CCF多媒体专委会
1+阅读 · 2022年2月13日
【ICIG2021】Latest News & Announcements of the Workshop
中国图象图形学学会CSIG
0+阅读 · 2021年12月20日
【ICIG2021】Latest News & Announcements of the Plenary Talk2
中国图象图形学学会CSIG
0+阅读 · 2021年11月2日
【ICIG2021】Latest News & Announcements of the Plenary Talk1
中国图象图形学学会CSIG
0+阅读 · 2021年11月1日
【ICIG2021】Latest News & Announcements of the Industry Talk1
中国图象图形学学会CSIG
0+阅读 · 2021年7月28日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
相关基金
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
5+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员