Human observers engage in selective information uptake when classifying visual patterns. The same is true of deep neural networks, which currently constitute the best performing artificial vision systems. Our goal is to examine the congruence, or lack thereof, in the information-gathering strategies of the two systems. We have operationalized our investigation as a character recognition task. We have used eye-tracking to assay the spatial distribution of information hotspots for humans via fixation maps and an activation mapping technique for obtaining analogous distributions for deep networks through visualization maps. Qualitative comparison between visualization maps and fixation maps reveals an interesting correlate of congruence. The deep learning model considered similar regions in character, which humans have fixated in the case of correctly classified characters. On the other hand, when the focused regions are different for humans and deep nets, the characters are typically misclassified by the latter. Hence, we propose to use the visual fixation maps obtained from the eye-tracking experiment as a supervisory input to align the model's focus on relevant character regions. We find that such supervision improves the model's performance significantly and does not require any additional parameters. This approach has the potential to find applications in diverse domains such as medical analysis and surveillance in which explainability helps to determine system fidelity.


翻译:人类观察家在对视觉模式进行分类时有选择地进行信息采集。 深神经网络也是同样的情况,这种网络目前是最佳的人工视觉系统。 我们的目标是检查这两个系统的信息收集战略的相容性或缺乏这种一致性。 我们已经将我们的调查作为一种特征识别任务加以操作。 我们使用眼睛跟踪来分析人类信息热点的空间分布,通过固定地图和启动绘图技术,通过可视化地图获取深海网络的类似分布。 对视觉化地图和固定地图的定性比较显示一个有趣的一致性相关性。 深度学习模型认为,在性质上相似的区域,人类在正确分类的字符中固定了这些区域。 另一方面,当重点区域对人和深网不同时,这些字符通常被后者错误地分类。 因此,我们提议使用从眼跟踪实验中获得的视觉固定地图作为监督性投入,以调整模型对相关特征区域的关注。 我们发现,这种监督极大地改进了模型的性能,而人类在正确分类的字符方面没有固定性,因此不需要在任何不同的区域中确定任何真实性参数。

0
下载
关闭预览

相关内容

利用计算机自动识别字符的技术,是模式识别应用的一个重要领域。人们在生产和生活中,要处理大量的文字、报表和文本。为了减轻人们的劳动,提高处理效率,50年代开始探讨一般文字识别方法,并研制出光学字符识别器。60年代出现了采用磁性墨水和特殊字体的实用机器。60年代后期,出现了多种字体和手写体文字识别机,其识别精度和机器性能都基本上能满足要求。如用于信函分拣的手写体数字识别机和印刷体英文数字识别机。70年代主要研究文字识别的基本理论和研制高性能的文字识别机,并着重于汉字识别的研究。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
专知会员服务
61+阅读 · 2021年6月22日
【如何做研究】How to research ,22页ppt
专知会员服务
108+阅读 · 2021年4月17日
简评 | Video Action Recognition 的近期进展
极市平台
20+阅读 · 2019年4月21日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
计算机 | CCF推荐会议信息10条
Call4Papers
5+阅读 · 2018年10月18日
人工智能 | 国际会议截稿信息9条
Call4Papers
4+阅读 · 2018年3月13日
计算机类 | 国际会议信息7条
Call4Papers
3+阅读 · 2017年11月17日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
Arxiv
4+阅读 · 2020年3月27日
Arxiv
6+阅读 · 2019年4月4日
Interpretable Active Learning
Arxiv
3+阅读 · 2018年6月24日
VIP会员
相关VIP内容
专知会员服务
61+阅读 · 2021年6月22日
【如何做研究】How to research ,22页ppt
专知会员服务
108+阅读 · 2021年4月17日
Top
微信扫码咨询专知VIP会员