关于yolo_loss函数的疑问
收藏
官方paddle.vision.ops给出的yolo_loss中要给出这几个参数: yolo_loss(x, gt_box, gt_label, anchors, anchor_mask, class_num, ignore_thresh, downsample_ratio, gt_score=None, use_label_smooth=True, name=None, scale_x_y=1.0)
其中对于gt_box,文档中说真实框,应该是[N,B,4]的形状。第三维用来承载x、y、w、h,其中 x, y是真实框的中心坐标,w, h是框的宽度和高度,且x、y、w、h将除以输入图片的尺寸,缩放到[0,1]区间内。 N是batch size,B是图像中所含有的的最多的box数目。
其中有疑问的是B这个参数,每个图像的真实box数目不同,这里取得是batch中所有图像的最大值么?
0
收藏
请登录后评论
应该是有个默认值,你看看源码
是的,对于参数B,文档中所描述的确实是取batch中所有图像的最大值。这个参数用于指定每个图像中可能存在的真实框的最大数量。