首页 PaddleCV 帖子详情
关于yolo_loss函数的疑问
收藏
快速回复
PaddleCV 问答目标检测 292 2
关于yolo_loss函数的疑问
收藏
快速回复
PaddleCV 问答目标检测 292 2

官方paddle.vision.ops给出的yolo_loss中要给出这几个参数: yolo_loss(x, gt_box, gt_label, anchors, anchor_mask, class_num, ignore_thresh, downsample_ratio, gt_score=None, use_label_smooth=True, name=None, scale_x_y=1.0)

其中对于gt_box,文档中说真实框,应该是[N,B,4]的形状。第三维用来承载x、y、w、h,其中 x, y是真实框的中心坐标,w, h是框的宽度和高度,且x、y、w、h将除以输入图片的尺寸,缩放到[0,1]区间内。 N是batch size,B是图像中所含有的的最多的box数目。

其中有疑问的是B这个参数,每个图像的真实box数目不同,这里取得是batch中所有图像的最大值么?

0
收藏
回复
全部评论(2)
时间顺序
李长安
#2 回复于2022-07

应该是有个默认值,你看看源码

0
回复
wl_zzz
#4 回复于2023-02

是的,对于参数B,文档中所描述的确实是取batch中所有图像的最大值。这个参数用于指定每个图像中可能存在的真实框的最大数量。

0
回复
需求/bug反馈?一键提issue告诉我们
发现bug?如果您知道修复办法,欢迎提pr直接参与建设飞桨~
在@后输入用户全名并按空格结束,可艾特全站任一用户