Inspired by the conclusion that human choose the visual cortex regions which corresponding to the real size of the object to analyze the features of the object, when realizing the objects in the real world. This paper presents a framework -- SizeNet which based on both the real sizes and the features of objects, to solve objects recognition problems. SizeNet was used for the objects recognition experiments on the homemade Rsize dataset, and compared with State-of-the-art Methods AlexNet, VGG-16, Inception V3, Resnet-18 DenseNet-121. The results show that SizeNet provides much higher accuracy rates for the objects recognition than the other algorithms. SizeNet can solve the two problems that correctly recognize the objects whose features are highly similar but the real sizes are obviously different from each other, and correctly distinguish the target object from the interference objects whose real sizes are obviously different from the target object. This is because SizeNet recognizes the object based not only the features, but also the real size. The real size of the object can help to exclude the interference object categories whose real size ranges do not match the real size of the object, which greatly reducing the object categories' number in the label set used for the downstream object recognition based on object features. SizeNet is of great significance to the study of interpretable computer vision. Our code and dataset will be made public.


翻译:受以下结论启发, 人类在现实世界中实现对象时, 选择与对象真实大小相对应的视觉皮层区域, 以分析对象的特性。 本文提供了一个框架 -- -- 大小网, 它基于物体的实际大小和特性, 来解决物体识别问题。 大小网用于在自制缩放数据集上进行物体识别实验, 并与“ 状态-艺术方法” AlexNet、 VGG-16、 Inception V3、 Resnet-18 DenseNet-121 进行比较。 结果显示, 大小网为物体识别的精确率比其他算法要高得多。 大小网可以解决正确识别特征非常相似但实际大小明显不同的物体的两个问题, 并正确地区分目标对象与实际大小明显与目标对象不同的干扰对象。 这是因为, 大小网将对象识别对象不仅基于特性, 并且与实际大小。 对象的实际大小范围可以帮助排除干扰对象类别与物体实际大小不匹配的物体识别率。 规模网能解决两个问题, 正确识别物体的物体特性, 但实际大小明显不同, 的大小与对象的尺寸 网络 的尺寸 的尺寸将使得我们使用 的 的 目标 的 的 的 目标 的 的 的 的 的 的 的 目标 的 的 的 的 的 的 的 的 的 尺寸将 尺寸 尺寸 的 的 的 的 尺寸 尺寸将 尺寸 的 的 的 尺寸 的 的 尺寸 尺寸 尺寸 的 的 的 的 尺寸 尺寸 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 将 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 将 和 的 的 的 和 的 的 的 的 的

1
下载
关闭预览

相关内容

【ICLR2020-】基于记忆的图网络,MEMORY-BASED GRAPH NETWORKS
专知会员服务
108+阅读 · 2020年2月22日
【ICLR-2020】网络反卷积,NETWORK DECONVOLUTION
专知会员服务
37+阅读 · 2020年2月21日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
机器学习入门的经验与建议
专知会员服务
89+阅读 · 2019年10月10日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
Fully-Convolutional Siamese Networks for Object Tracking论文笔记
统计学习与视觉计算组
9+阅读 · 2018年10月12日
计算机视觉的不同任务
专知
5+阅读 · 2018年8月27日
【推荐】ResNet, AlexNet, VGG, Inception:各种卷积网络架构的理解
机器学习研究会
20+阅读 · 2017年12月17日
【推荐】YOLO实时目标检测(6fps)
机器学习研究会
20+阅读 · 2017年11月5日
可解释的CNN
CreateAMind
17+阅读 · 2017年10月5日
【推荐】视频目标分割基础
机器学习研究会
9+阅读 · 2017年9月19日
【推荐】深度学习目标检测概览
机器学习研究会
10+阅读 · 2017年9月1日
Arxiv
4+阅读 · 2020年3月27日
Arxiv
3+阅读 · 2018年6月14日
VIP会员
相关资讯
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
Fully-Convolutional Siamese Networks for Object Tracking论文笔记
统计学习与视觉计算组
9+阅读 · 2018年10月12日
计算机视觉的不同任务
专知
5+阅读 · 2018年8月27日
【推荐】ResNet, AlexNet, VGG, Inception:各种卷积网络架构的理解
机器学习研究会
20+阅读 · 2017年12月17日
【推荐】YOLO实时目标检测(6fps)
机器学习研究会
20+阅读 · 2017年11月5日
可解释的CNN
CreateAMind
17+阅读 · 2017年10月5日
【推荐】视频目标分割基础
机器学习研究会
9+阅读 · 2017年9月19日
【推荐】深度学习目标检测概览
机器学习研究会
10+阅读 · 2017年9月1日
Top
微信扫码咨询专知VIP会员