首页 AI Studio教育版 帖子详情
【飞桨】【论文复现】BIGGAN论文解读
收藏
快速回复
AI Studio教育版 文章课程答疑 1465 14
【飞桨】【论文复现】BIGGAN论文解读
收藏
快速回复
AI Studio教育版 文章课程答疑 1465 14

课程链接:https://aistudio.baidu.com/aistudio/education/group/info/1340

论文名称:Large scale GAN training for high fidelity natural image synthesis

本文仅从该论文采用的有效tricks和tricks带来的增益方面进行解读。

1.综述

尽管最近在生成性图像建模方面取得了进展,但是从诸如ImageNet之类的复杂数据集中成功生成高分辨率、多样的样本仍然是一个难以实现的目标。

文章希望既保证GAN生成图像的保真度又保证生成图像的多样性,对此,作者认为他们有三点贡献:

1、论证了GANs能通过scaling来提升性能。他们使用与原先技术相比,2~4倍的参数量和8倍的batch size,引入了两种简单的结构调整方法来提升网络的可扩展性,并修改一种正则化方案来提高conditioning。
2、上述修改产生的另一种影响是,模型非常适用于“trucation trick”,它是一种简单的采样技术,可以对样本多样性与保真性进行外部地细粒度地调节。
3、发现大型GAN特有的不稳定性,并从经验上对他们进行描述。经过分析表明通过现有技术与创新的技术的结合能够减少这种不稳定性,但是训练时完全的稳定性只能通过以较大地牺牲模型表现来实现。

作者训练的class-condition GAN在ImageNet上的表现很好(128X128分辨率),与state-of-art相比,Inception Score(IS)从52.52提升到166.3,Frechet Inception Distance(FID)从18.65下降到9.6.

评价指标:

1)IS--Inception Score:一般用来评价生成图片的质量和多样性 越大越好

2)FID--Fréchet Inception Distance:一般用来评价生成图片的质量和多样性,FID越小,则图像多样性越好,质量也越好

技巧方面:

1)这篇论文没有提出新的模型,只是将原有的GAN的模型,用8倍原有的batch size大小,并且将隐藏层的变量数量扩充到原有模型的4倍以后,进行训练获得了很好的图片生成的效果。与此同时,在扩充了变量数量和batch size大小后,模型出现了不稳定的现象,文章中对出现的不稳定现象,采用现有的比较有效的稳定训练GAN的方法,但是文中发现这样确实会稳定GAN的训练,但是同时会牺牲生成图片的质量。

2)提高通道数,将每层的通道数提升为原来的两倍,参数量进而翻番,这使得IS评分上升了21%。

3)共享嵌入层,文中对于类信息c使用batch norm处理,并采用了共享的策略,将c的信息传递给每一层中,这样可以提高性能,减少计算量。这使得模型训练速度提高了37%。

4)多层级潜在空间,作者使用了多种hierarchical latent spaces,即将噪声向量输入到生成器的不同层中,而不是仅仅输入到第一层。这种做的思路是用潜在空间来直接影响不同分辨率以及不同层次下的特征。hierarchical latents降低了计算量与内存占用,模型表现提升4%,训练速度提高18%。

5)截断技巧,一般的噪声向量服从分布z∼N(0,I)z\sim\mathcal{N}(0,I)z∼N(0,I),但该技巧为其采样设置一个阈值,当采样超过该阈值时,重新采样,以使得采样点落入阈值范围。减小该阈值会发现,GAN生成的图像多样性降低,质量提高。这个技巧能很好的提高生成图片的质量,但是会降低生成图片的多样性。但是,有些模型不会服从截断(也就是说,使用了截断技巧,但是没有提升产生图片的质量),文章尝试用正交化初始化的方式,解决这个问题,最终找到较好的正则化权重。

文章中同时也对于GAN训练的稳定性做了研究,首先他们发现了生成器G的第一层的最大奇异值,会在发生模式崩塌的情况下,剧烈变化并且爆炸增长。但是限制这一层权重的增长,以限定其最大奇异值的变化,并没有保证获得模型的稳定,因而他们认为第一层最大奇异值的变化,是模式崩塌发生的征兆,而不是原因。
文章近一步研究了分辨器的模式崩塌的情况,发现在模式崩塌发生的时候,其权重的奇异值会发现跳跃,同时文章尝试了很多正则化的方法来防止模式崩塌的现象,发现采用了这些正则化的方法,可能会防止模式崩塌,但是这是以生成样本的质量为代价的。因而文章给出的建议是,在现有的技术情况下,可以考虑松弛防止模式崩塌的约束,或者就让模式崩塌发生,从而换取更好的模型生成的图片的质量。

2
收藏
回复
全部评论(14)
时间顺序
AIStudio810258
#2 回复于2020-08

论文的重点把握的挺精准的啊

0
回复
AIStudio810258
#3 回复于2020-08

期待复现!

0
回复
RayAction
#4 回复于2020-08
论文的重点把握的挺精准的啊

巨佬出现?5k积分啊~

0
回复
AIStudio810258
#5 回复于2020-08
巨佬出现?5k积分啊~

哈哈,那是因为大佬们都把分兑mac了~~

加油!一起努力!

0
回复
RayAction
#6 回复于2020-08
哈哈,那是因为大佬们都把分兑mac了~~ 加油!一起努力!

话说兑换的mac是什么配置的?哪款?我听听馋馋

0
回复
AIStudio810258
#7 回复于2020-08
话说兑换的mac是什么配置的?哪款?我听听馋馋

大佬们应该是一年前兑的,不知道现在是哪款

0
回复
AIStudio810258
#8 回复于2020-08

拿2w想买哪款买哪款~~

0
回复
AIStudio810258
#9 回复于2020-08
大佬们应该是一年前兑的,不知道现在是哪款

给的键盘之类的好像有几种不同的型号,所以mac也说不好,看图片也看不太清楚~~

0
回复
L
LOceanOceanL
#10 回复于2020-08

向大佬学习

0
回复
RayAction
#11 回复于2020-08
给的键盘之类的好像有几种不同的型号,所以mac也说不好,看图片也看不太清楚~~

哈哈哈哈。一年前大佬们都换了,酸了

0
回复
w
wangwei8638
#12 回复于2020-08

学习了

0
回复
luckydu
#13 回复于2020-08

0
回复
AIStudio810258
#14 回复于2020-08
RayAction #11
哈哈哈哈。一年前大佬们都换了,酸了

有空问问换过的大佬,“猪肉”啥型号的~~

0
回复
Mr.郑先生_
#15 回复于2020-08

赞!

0
回复
在@后输入用户全名并按空格结束,可艾特全站任一用户