真假二分类问题用 MSE 还是BCE loss？

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

AIStudio810258 发布于2020-08

cycleGAN 的判别器判别图片的真假为何用 MSE 而不是二分类的 BCE loss ？

全部评论(43)

笨笨

#2 回复于2020-08

BCE loss 一般是多个标签的二分类吧，这里只有真假一个标签的2分类。选MSE可能也是因为比较平滑好训练吧

thinc

#3 回复于2020-08

其实还可以用负对数似然

AIStudio810258

#4 回复于2020-09

笨笨 #2

BCE loss 一般是多个标签的二分类吧，这里只有真假一个标签的2分类。选MSE可能也是因为比较平滑好训练吧

谢谢，后来我又找了些文章看了看。有人用3d空间里loss 算出来的平面展示了两种loss 的区别

AIStudio810258

#5 回复于2020-09

笨笨 #2

BCE loss 一般是多个标签的二分类吧，这里只有真假一个标签的2分类。选MSE可能也是因为比较平滑好训练吧

我也照公式写了下，发现具体同时还得加个exp 防止计算中有非法值产生nan

AIStudio810258

#6 回复于2020-09

thinc #3

其实还可以用负对数似然

这个我也去试试

AIStudio810258

#7 回复于2020-09

thinc #3

其实还可以用负对数似然

loss 函数能改进 gan 的稳定性

AIStudio810258

#8 回复于2020-09

thinc #3

其实还可以用负对数似然

但需要数序功底深厚才能正确分析。

我就直接用lsgan、wgan了，哈哈～～

thinc

#9 回复于2020-09

AIStudio810258 #8

但需要数序功底深厚才能正确分析。我就直接用lsgan、wgan了，哈哈～～

确实，wgan提出就很牛*

AIStudio810258

#10 回复于2020-09

thinc #9

确实，wgan提出就很牛*

原来这些gan 比原版的gan 好，是因为他们是所谓“最大距离分类器"。交叉熵损失只计算分类，不计算距离

thinc

#11 回复于2020-09

AIStudio810258 #10

原来这些gan 比原版的gan 好，是因为他们是所谓“最大距离分类器"。交叉熵损失只计算分类，不计算距离

参考系不一样

AIStudio810258

#12 回复于2020-09

thinc #11

参考系不一样

什么意思?

AIStudio810258

#13 回复于2020-09

thinc #11

参考系不一样

是说替换js散度吧

thinc

#14 回复于2020-09

AIStudio810258 #12

什么意思?

GAN虽然都是图像生成，但具体细分有CycleGAN这种图像翻译，Pixel GAN这种超分辨...不同的GAN用的loss不太一样的

thinc

#15 回复于2020-09

thinc #14

GAN虽然都是图像生成，但具体细分有CycleGAN这种图像翻译，Pixel GAN这种超分辨...不同的GAN用的loss不太一样的

我也只是随便讲讲，在GAN面前还是大佬你牛

AIStudio810258

#16 回复于2020-09

thinc #14

GAN虽然都是图像生成，但具体细分有CycleGAN这种图像翻译，Pixel GAN这种超分辨...不同的GAN用的loss不太一样的

嗯，感觉gan的一般精髓在loss

thinc

#17 回复于2020-09

AIStudio810258 #16

嗯，感觉gan的一般精髓在loss

嗯嗯不同的GAN loss都不太一样，有一个人脸融合的模型就是用的其他loss，复现起来还有点难度

AIStudio810258

#18 回复于2020-09

thinc #17

嗯嗯不同的GAN loss都不太一样，有一个人脸融合的模型就是用的其他loss，复现起来还有点难度

前两天看了一篇博客，专门介绍一个l1、l2自适应loss 函数，感觉思路和ugatit 里的adaLIN 一模一样

AIStudio810258

#19 回复于2020-09

thinc #17

嗯嗯不同的GAN loss都不太一样，有一个人脸融合的模型就是用的其他loss，复现起来还有点难度

期待项目～

thinc

#20 回复于2020-09

AIStudio810258 #19

期待项目～

想搞，但是有难度。。。

thinc

#21 回复于2020-09

AIStudio810258 #18

前两天看了一篇博客，专门介绍一个l1、l2自适应loss 函数，感觉思路和ugatit 里的adaLIN 一模一样

有链接么