YOLOv3的例子,为什么要对原始坐标,width和height做处理?
收藏
# 这里使用xywh格式来表示目标物体真实框
gt_bbox[i] = [(x1+x2)/2.0 , (y1+y2)/2.0, x2-x1+1., y2-y1+1.]
为什么要做(x1+x2)/2.0, x2-x1+1.这样的处理?
0
收藏
请登录后评论
啊这,这是归一化呀,xywh的表示方法
你在平台上看一下那个yolov3的教程。
在 YOLOv3 的目标检测算法中,使用 xywh 格式来表示目标物体的真实框,其中 xy 表示矩形框的中心点坐标,而 wh 表示矩形框的宽度和高度。
在将目标的真实框转换成 xywh 格式时,需要对原始坐标和宽度、高度做一些处理。
对于目标框的中心点坐标,需要将左上角坐标和右下角坐标相加,再除以 2 得到中心点坐标。这样做的目的是为了将左上角坐标和右下角坐标的信息合并,得到一个更精确的目标位置信息。
对于目标框的宽度和高度,需要将左上角坐标和右下角坐标的差值加上 1。这是因为在计算宽度和高度时,需要考虑边界像素的影响,加上 1 可以保证目标框完整地包含目标物体。