网站500错误是什么意思,wordpress  数据库,邯郸网络广播电视台,工业互联网平台系统笔者在2022年开始学习目标检测的时候#xff0c;对各种框的概念那是相当混淆#xff0c;比如#xff1a; 中文名词#xff1a;边界框、锚框、真实框、预测框等英文名词#xff1a;BoundingBox、AnchorBox、Ground Truth等 同一个英文名词比如BoundingBox翻译成中文也有多个… 笔者在2022年开始学习目标检测的时候对各种框的概念那是相当混淆比如 中文名词边界框、锚框、真实框、预测框等英文名词BoundingBox、AnchorBox、Ground Truth等 同一个英文名词比如BoundingBox翻译成中文也有多个叫法。下面注重区分这些概念。 一、真实框Ground Truth  边界框Bounding Box 
1️⃣真实框Ground Truth与边界框Bounding Box的定义 
目标检测需要识别图片中多个物体的位置与类别。 
为了方便模型训练我们人为地将图片中物体的位置与种类标注出来这就是真实边界框Ground Truth。 
「Ground Truth」等价于「Ground Truth Bounding BoxGT BBox」 
边界框Bounding Box则更多的是一种泛指它可以指代各个类型的框。 2️⃣GT BBox的标注常见于两种形式 
PascalVOC的xml标注文件 ( x 1 , y 1 , x 2 , y 2 ) (x_1, y_1, x_2, y_2) (x1,y1,x2,y2)分别是矩形框左上角、右下角的坐标 如下图中的坐标(1, 1)。COCO的json标注文件 ( x , y , w , h ) (x, y, w, h) (x,y,w,h)xy是矩阵框的中心点坐标wh是矩阵框的宽高 
标注文件中每行表示一个物体一般是图片文件名、物体类别、边缘框。 二、边界框的回归 BoundingBox Regression 
模型对其「预测框」进行微调使其接近Ground Truth Bounding Box。 如下图对红色的BBox回归使其接近绿色的GT Box。 三、锚框Anchor Box 
1️⃣Ground Truth Bounding Box与Anchor的区别 
锚框Anchor是算法自动生成出的GT BBox是人为的标注框。 
目前定位精准的目标检测算法还是基于锚框的即Anchor-based。 2️⃣锚框的使用 #mermaid-svg-6c8fOAQyPmL9Gelc {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-6c8fOAQyPmL9Gelc .error-icon{fill:#552222;}#mermaid-svg-6c8fOAQyPmL9Gelc .error-text{fill:#552222;stroke:#552222;}#mermaid-svg-6c8fOAQyPmL9Gelc .edge-thickness-normal{stroke-width:2px;}#mermaid-svg-6c8fOAQyPmL9Gelc .edge-thickness-thick{stroke-width:3.5px;}#mermaid-svg-6c8fOAQyPmL9Gelc .edge-pattern-solid{stroke-dasharray:0;}#mermaid-svg-6c8fOAQyPmL9Gelc .edge-pattern-dashed{stroke-dasharray:3;}#mermaid-svg-6c8fOAQyPmL9Gelc .edge-pattern-dotted{stroke-dasharray:2;}#mermaid-svg-6c8fOAQyPmL9Gelc .marker{fill:#333333;stroke:#333333;}#mermaid-svg-6c8fOAQyPmL9Gelc .marker.cross{stroke:#333333;}#mermaid-svg-6c8fOAQyPmL9Gelc svg{font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;}#mermaid-svg-6c8fOAQyPmL9Gelc .label{font-family:"trebuchet ms",verdana,arial,sans-serif;color:#333;}#mermaid-svg-6c8fOAQyPmL9Gelc .cluster-label text{fill:#333;}#mermaid-svg-6c8fOAQyPmL9Gelc .cluster-label span{color:#333;}#mermaid-svg-6c8fOAQyPmL9Gelc .label text,#mermaid-svg-6c8fOAQyPmL9Gelc span{fill:#333;color:#333;}#mermaid-svg-6c8fOAQyPmL9Gelc .node rect,#mermaid-svg-6c8fOAQyPmL9Gelc .node circle,#mermaid-svg-6c8fOAQyPmL9Gelc .node ellipse,#mermaid-svg-6c8fOAQyPmL9Gelc .node polygon,#mermaid-svg-6c8fOAQyPmL9Gelc .node path{fill:#ECECFF;stroke:#9370DB;stroke-width:1px;}#mermaid-svg-6c8fOAQyPmL9Gelc .node .label{text-align:center;}#mermaid-svg-6c8fOAQyPmL9Gelc .node.clickable{cursor:pointer;}#mermaid-svg-6c8fOAQyPmL9Gelc .arrowheadPath{fill:#333333;}#mermaid-svg-6c8fOAQyPmL9Gelc .edgePath .path{stroke:#333333;stroke-width:2.0px;}#mermaid-svg-6c8fOAQyPmL9Gelc .flowchart-link{stroke:#333333;fill:none;}#mermaid-svg-6c8fOAQyPmL9Gelc .edgeLabel{background-color:#e8e8e8;text-align:center;}#mermaid-svg-6c8fOAQyPmL9Gelc .edgeLabel rect{opacity:0.5;background-color:#e8e8e8;fill:#e8e8e8;}#mermaid-svg-6c8fOAQyPmL9Gelc .cluster rect{fill:#ffffde;stroke:#aaaa33;stroke-width:1px;}#mermaid-svg-6c8fOAQyPmL9Gelc .cluster text{fill:#333;}#mermaid-svg-6c8fOAQyPmL9Gelc .cluster span{color:#333;}#mermaid-svg-6c8fOAQyPmL9Gelc div.mermaidTooltip{position:absolute;text-align:center;max-width:200px;padding:2px;font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:12px;background:hsl(80, 100%, 96.2745098039%);border:1px solid #aaaa33;border-radius:2px;pointer-events:none;z-index:100;}#mermaid-svg-6c8fOAQyPmL9Gelc :root{--mermaid-font-family:"trebuchet ms",verdana,arial,sans-serif;}                                      是            在训练集上利用k-means等方法聚类出多个大小宽高不同的锚框           预测:每个锚框中是否含有目标物体           预测:从该锚框到边界框的偏移          3️⃣在目标检测任务中我们如何选择锚框尺寸 
1要么设定好锚框的尺寸 anchors:- [10,13, 16,30, 33,23]  # P3/8- [30,61, 62,45, 59,119]  # P4/16- [116,90, 156,198, 373,326]  # P5/322要么通过k-means自动生成锚框比如yolov5默认通过k-means自动生成锚框尺寸 
3作为超参数学习。我还没见过估计这会产生额外的计算量 4️⃣锚框的标注过程 
主流的目标检测算法大多基于锚框Anchor Box每一个锚框都是一个训练样本。 
对于每个锚框要么标注成背景负样本要么关联上一个真实边界框正样本。 
一张图片可能会产生上万个锚框其中绝大多数都是背景即大量的负样本与之相比正样本可能只有几十个。 图. 锚框的标注 假设4个目标物体对应着4个GT BBox模型对每个目标物体各生成9个锚框计算每个GT与Anchor之间的IoU值找到当前最大的IoU值 x 23 x_{23} x23将锚框关联上BBox_3由它去预测BBox_3。删去该行该列继续找当前最大的IoU值 x 71 x_{71} x71重复如上操作删去该行该列 
与BBox关联的锚框作为正样本其他的作为背景就是负样本。 PSAnchor的概念最早出现在Faster RCNN提出的RPN网络RPN网络的Anchor启发了后面的SSD和Yolov2算法。 四、额外召回与排序的概念 
召回将所有“可能的正确结果”返回给排序 
排序会将所有召回的结果进行排序将最靠前的结果作为最终答案 如果这篇文章对您有些许帮助请帮忙点个赞或收个藏。您的支持是我继续创作的动力  不要害怕不要着急。保持每日的前进☀️与积极的内心❤️命运总在曲折中馈赠最好的礼物。