给网站做图,app开发定制外包服务商e,wordpress基本功能,上海最近新闻事件文章目录 前言一、R-CNN的网络结构及步骤二、RCNN的创新点候选区域法特征提取-CNN网络 总结 前言
在前文#xff1a;目标检测之序章-类别、必读论文和算法对比#xff08;实时更新#xff09;已经提到传统的目标检测算法的基本流程#xff1a; 图像预处理 寻找候选区… 文章目录 前言一、R-CNN的网络结构及步骤二、RCNN的创新点候选区域法特征提取-CNN网络 总结 前言
在前文目标检测之序章-类别、必读论文和算法对比实时更新已经提到传统的目标检测算法的基本流程 图像预处理 寻找候选区 特征提取 分类器分类 后处理
传统目标检测的主要问题是
1寻找候选区的方法缺陷基于滑动窗口的区域选择策略没有针对性时间复杂度高窗口冗余速度慢2手工设计的特征对于多样性的变化没有很好的鲁棒性
2012年卷积神经网络CNN开始大放异彩开启了基于深度学习算法图像分类的热潮。
2014年RBGRoss B. Girshick使用Region Proposal CNN代替传统目标检测使用的滑动窗口手工设计特征设计了R-CNN框架使得目标检测取得巨大突破并开启了基于深度学习目标检测的热潮。 为了解决上述传统目标检测需要遍历图像的缺陷出现了候选区域Region Proposal法即利用图像中的纹理、边缘、颜色等信息预先找出图中可能含有物体的候选区域/框可以保证在选取较少窗口(几千甚至几百的情况下保持较高的召回率Recall文中使用的是Selective Search候选区域法。 R-CNN在PASCAL VOC 2010上实现了53.7%的平均精度mAP)并在VOC 2011/12 test测试集中实现了类似的性能53.3% mAP 提示以下是本篇文章正文内容下面内容可供参考
一、R-CNN的网络结构及步骤
提取候选区域Region Proposal ps利用Selective Search算法在图像中从下到上提取2000个左右的可能包含物体且大小不一的候选区域Region Proposal 预训练分类模型如AlexNet 微调fine-tuning / 从头开始训练模型利用训练好的模型进行特征提取获取候选区特征图 ps将每个Region Proposal缩放warp成统一的227x227的大小并输入到CNN网络将CNN网络的输出作为特征 训练一个SVM分类器根据CNN特征图进行分类利用非极大值抑制NMS去除冗余候选区训练一个线性回归模型精修正确的候选框位置及大小 二、RCNN的创新点
使用候选区域法Region Proposal代替穷尽策略大大缩小了计算量利用CNN参数共享和特征提取的优势改善了提取特征的速度和质量
候选区域法 有很多候选区域法当时最出色的是选择性搜索selective search。它的工作原理是将图片中的每一个像素作为一组然后计算每个像素的纹理将相近的的组合起来形成更大的像素组然后继续合并各个像素组。下图中展示了像素组是如何扩大的蓝色矩形代表了真实图片各像素组合并后的外界矩形框。
特征提取-CNN网络
原文中使用的是AlexNet当然也可以使用其他卷积神经网络。 总结
R-CNN虽然不再像传统方法那样穷举但R-CNN流程的第一步中对原始图片通过Selective Search提取的候选框region proposal多达2000个且这2000个候选框每个框都需要进行CNN提特征SVM分类计算量很大导致R-CNN检测速度很慢GPU上大于13s/imageCPU上大于53s/image。
其次将所有候选区域统一缩放到统一大小CNN输入大小是确定的会导致图像变形失真从而降低精度。