【导读】Faster-RCNN是目标检测的一种算法,而RPN(Region Proposal Network)用于在特征图上产生候选预测区域。本文主要介绍RPN的运行机制。
第一步
输入图像通过卷积网络,在网络的最后一个卷积层上输出一组卷积特征图,如下图:
第二步
滑动窗口在这些特征图上滑动,滑动窗口的大小为NxN,这里是3x3。每个滑动窗口,都会生成一组9个锚框,它们都具有相同的中心
但有3种不同的ratio(长宽比)和3种不同的scale(比例),如下所示。注意,所有这些坐标都是相对于原始图像计算的。
此外,每个锚框都对应着一个p*,p*表示锚框(anchor box)与真实图片(baounding box)的重叠度。
其中,iou是交集占合集的比例,如下计算:
第三步
最后,从那些卷积特征图中提取的3×3空间特征(如上面红框中所示)被送到较小的网络,该网络具有两个任务:分类(cls)和回归(reg)。回归的输出确定预测的边界框(x,y,w,h),分类的输出是指示预测的框是否包含对象的概率p或者它来自背景(不包含对象)。
损失函数在两个子网的输出上定义,由两项相加,还有个平衡因子λ。
参考链接:
https://www.quora.com/How-does-the-region-proposal-network-RPN-in-Faster-R-CNN-work
-END-
专 · 知
专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎登录www.zhuanzhi.ai,注册登录专知,获取更多AI知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程视频资料和与专家交流咨询!
请加专知小助手微信(扫一扫如下二维码添加),加入专知人工智能主题群,咨询技术商务合作~
专知《深度学习:算法到实战》课程全部完成!560+位同学在学习,现在报名,限时优惠!网易云课堂人工智能畅销榜首位!
点击“阅读原文”,了解报名专知《深度学习:算法到实战》课程