YOLOv3的例子，为什么要对原始坐标，width和height做处理？

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

魔魔王我也发布于2022-08

# 这里使用xywh格式来表示目标物体真实框
gt_bbox[i] = [(x1+x2)/2.0 , (y1+y2)/2.0, x2-x1+1., y2-y1+1.]

为什么要做(x1+x2)/2.0， x2-x1+1.这样的处理？

全部评论(4)

李长安

#2 回复于2022-09

啊这，这是归一化呀，xywh的表示方法

李长安

#3 回复于2022-09

你在平台上看一下那个yolov3的教程。

wl_zzz

#4 回复于2023-02

在 YOLOv3 的目标检测算法中，使用 xywh 格式来表示目标物体的真实框，其中 xy 表示矩形框的中心点坐标，而 wh 表示矩形框的宽度和高度。

在将目标的真实框转换成 xywh 格式时，需要对原始坐标和宽度、高度做一些处理。

wl_zzz

#5 回复于2023-02

对于目标框的中心点坐标，需要将左上角坐标和右下角坐标相加，再除以 2 得到中心点坐标。这样做的目的是为了将左上角坐标和右下角坐标的信息合并，得到一个更精确的目标位置信息。
对于目标框的宽度和高度，需要将左上角坐标和右下角坐标的差值加上 1。这是因为在计算宽度和高度时，需要考虑边界像素的影响，加上 1 可以保证目标框完整地包含目标物体。

提issue

需求/bug反馈？一键提issue告诉我们

提pr

发现bug？如果您知道修复办法，欢迎提pr直接参与建设飞桨~