目标检测YOLO预测框跟真实框重合问题
Kong_W_D 发布于2020-05 浏览:2335 回复:6
1
收藏

飞桨教程里面零基础入门深度学习里面,以yolo为例讲解目标检测问题时预测框与真实框重合问题。“令”后面的式子什么意思啊?看不懂了。小白求教大神帮忙解答。

收藏
点赞
1
个赞
共6条回复 最后由星光ld1回复于2020-05
#7星光ld1回复于2020-05
#4 Kong_W_D回复
gtx是一个变量是吗,我刚开始以为是g*tx,我还纳闷g是什么变量呢。那σ(tx*)就是真实框相对锚点框的距离微调量或者说误差,同样下面那个是边长的微调量,是吗?
展开

类似的ph,pw是锚框的长宽,exp(th)用来刻画与锚框高的偏差,显然这边要求一个>0的凉刻画,所以用了exp函数,然后th=0时刚好预测高度与锚框高度一样,对于pw的操作是类似的

0
#6星光ld1回复于2020-05
#4 Kong_W_D回复
gtx是一个变量是吗,我刚开始以为是g*tx,我还纳闷g是什么变量呢。那σ(tx*)就是真实框相对锚点框的距离微调量或者说误差,同样下面那个是边长的微调量,是吗?
展开

关于sigma(tx)是刻画预测框与锚框中心的偏移量,由于锚框生成比如M*N,那个每个锚框cx, cy就是整数,中心在cx+0.5,cy+0.5,期望这个偏移量是在0-1之间所以用sigma函数对tx做压缩,tx=0时预测中心与锚框中心重合

0
#5星光ld1回复于2020-05
#4 Kong_W_D回复
gtx是一个变量是吗,我刚开始以为是g*tx,我还纳闷g是什么变量呢。那σ(tx*)就是真实框相对锚点框的距离微调量或者说误差,同样下面那个是边长的微调量,是吗?
展开

gt是ground truth的缩写,ground truth会给出[x,y,w,h],所以这边分别记作gtx,gty,gtw,gth

0
#4Kong_W_D回复于2020-05
#3 星光ld1回复
原因上是因为ground truth本身带有一定约束,比如w, h>0,那么为了在网络优化时还是无约束优化,所以用函数变换了一下
展开

gtx是一个变量是吗,我刚开始以为是g*tx,我还纳闷g是什么变量呢。那σ(tx*)就是真实框相对锚点框的距离微调量或者说误差,同样下面那个是边长的微调量,是吗?

0
#3星光ld1回复于2020-05

原因上是因为ground truth本身带有一定约束,比如w, h>0,那么为了在网络优化时还是无约束优化,所以用函数变换了一下

1
#2星光ld1回复于2020-05

等号右侧是ground truth,训练的时候用的是左侧的带星号的量所以通过这个式子把标签转换成带*号的量

1
TOP
切换版块