今天给大家分享一个有趣的算法,也是大家都比较熟悉的感兴趣区域池化类算法框架,在疫情重要的时期,大家记得多休息,但不能忘和我们计算机视觉战队一起学习进步!
专家
解读
图像数据与一个或多个核卷积,并生成相应的一个或多个特征映射。感兴趣区域图是从一个或多个特征图中提取出来的,并基于候选的一个或多个特征进行合并。池化生成的特征向量维数小于与一个或多个特征映射相关联的维数。在神经网络中,特征向量被展平并作为一个层输入。神经网络输出与图像数据中的对象相关联的分类。
上图就是分类的特征选择过程,3个特征选择boxes用在了不同的类别上。特征选择box的数量取决于类别的数量。上图中的114就是感兴趣区域,106就是感兴趣区域池化后的特征图。其实在一副图片中有很多感兴趣区域。
下图是解释下CNN的运行过程,其实CNN可以学习一个对应的模式来提取重要的特征。其中216就是今天要提及的核心:
下图这个分别展示了Weven和Wodd的稀疏核:
Sparse ROI Pooling
ROI池化其实会导致稀疏和冗余的特征,特别是在水平和垂直不安全的位置(通过box突出显示)。本次技术主要是跳过奇数或者偶数索引的特征,通过这样做,他可以在不影响特征表示的情况下,将全连接层的参数减半。
CNN和目标检测的系统组件示意图
下图就展示了一个案例,检测图像中的目标方法的流程图。该方法至少由一个硬件处理器执行。702是图像的接收,图像数据可能包括真实数据。
END
如果想加入我们“计算机视觉战队”,请扫二维码加入学习群。计算机视觉战队主要涉及机器学习、深度学习等领域,由来自于各校的硕博研究生组成的团队,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。
我们开创一段时间的“计算机视觉协会”知识星球,也得到很多同学的认可,我们定时会推送实践型内容与大家分享,在星球里的同学可以随时提问,随时提需求,我们都会及时给予回复及给出对应的答复。
微信学习讨论群也可以加入,我们会第一时间在该些群里预告!