福建商城网站制作公司,产品宣传片制作公司,wordpress网站的cdn怎么设置,做虚假网站判多少年yolo算法介绍(2020-06-06 16:49:28)把Yolo模型搞清楚后不得不再次为人类的智慧感慨#xff0c;一个巧妙的模型。要想理解Yolo我们先要搞清楚Yolo到底要解决一个什么问题#xff0c;解决这个问题必须做哪些事情。Yolo属于多目标检测#xff0c;因此需要解决两个问题#xff…yolo算法介绍(2020-06-06 16:49:28)把Yolo模型搞清楚后不得不再次为人类的智慧感慨一个巧妙的模型。要想理解Yolo我们先要搞清楚Yolo到底要解决一个什么问题解决这个问题必须做哪些事情。Yolo属于多目标检测因此需要解决两个问题1)从一张图片中可以识别出多个不同种类的物体2)并且用一个框将每个物体分割出来既要得到物体的尺寸。直观来看这两个问题那一个是分类问题另一个是回归问题。分类问题就是说能够从图片中识别出不同物体种类回归问题是可以通过非线性拟合计算出物体的尺寸坐标。把握住解决问题的实质就可以明确样本训练如何设计了分类问题就是常规的图像识别而回归问题就需要我们提前画好一个框将被识别物体恰到好处的框起来这个框的尺寸就是就可以当做目标值。这样就建立了输入和输出的关系输入是图像输出是种类和尺寸。要对图片中一个物体进行分类首先要解决如何从图片中发现这个物体最直观的方法就是用不同尺寸的方框进行扫描这个方框可以被称为window和要得到的物体尺寸是两回事。这就是RNN的方法但这种方法计算量大因此出现了Yolo其核心思想就体现在如何从一张图像准确获取目标的方法上。基本思路就是先对图像进行划分划分成围棋格子那样之后以每个网格为核心进行目标检测。注意这里的格子仍然是window的概念不是物体尺寸具体过程是这样的训练对每个网格进行的这个网格是否能代表某一个物体及物体尺寸在训练集都是可以得到的。预测同样也是以每个网格进行的。这样就带来一个问题如果多个网格都说自己识别到了某一个物体该如何处理这里使用了基于IOU的非极大值抑制算法就是找到一个最合理的框以得分最高的为基准想同类并且IOU大于0.5的就说明是同一个物体想同类IOU小于0.5说明虽然是统一物体但可能出现在了照片不同位置。后来又发现一个问题同一个格子检测出两个物体怎么办这是就提出了Anchorbox的概念既一个格子之前的输出就是一个物体种类的信息那现在不是了可能是2个或3个。这时就带来了新问题这么多事先画好的预选框各种目标都可能重合怎么合理分配呢。这是就引入了聚类和金字塔的技术结合的方法1)聚类就是把不同预选框按照尺寸进行自动归类2)Yolo从模型上建立金字塔模式将不同预选框按照尺寸分配给不同的特征层。这样就实现了大尺寸在深层识别小尺寸在浅层识别还实现了语义上下文分析功能最终得到了完美的多目标检测算法。分享喜欢0赠金笔加载中请稍候......评论加载中请稍候...发评论登录名 密码 找回密码 注册记住登录状态昵 称评论并转载此博文发评论以上网友发言只代表其个人观点不代表新浪网的观点或立场。