首页 > Web开发 > 详细

Generative Adversarial Nets[LSGAN]

时间：2018-02-25 00:08:02 阅读：210 评论：0 收藏：0 [点我收藏+]

标签：数据生成最小 math sar cross 并且文字函数

0 背景

在这之前大家在训练GAN的时候，使用的loss函数都是sigmoid_cross_entropy_loss函数，然而xudon mao等人发现当使用伪造样本去更新生成器（且此时伪造样本也被判别器判为对的时候）会导致梯度消失的问题。虽然此时伪造样本仍然离真实样本分布距离还挺远。也就是之前的损失函数虽然可以判别是真假，可是对于人肉眼来说，还是违和感太强了，也就是生成的图像质量骗得过机器，却骗不过人。

技术分享图片

图0.1 两种损失函数的不同行为
上图中加号表示假样本，圈表示真样本，五角星表示用于更新生成器的伪造样本，红线表示LSGAN的决策面，蓝线表示sigmoid交叉熵的决策面。可以从图0.1.1中看出，sigmoid函数能分真假，可是对距离却并不敏感。

所以，由此，他们提出了更好的损失函数用于将伪造样本的分布推向于决策面（虽然无法直接推向真实样本的分布）。并且从中还发现，用此损失函数，可以增加训练GAN的稳定性。并且之前也有一些论文论述到GAN的不稳定训练一部分归咎于目标函数。特别是最小化之前GAN的目标函数时候的梯度消失问题，会导致更新生成器变得困难，而LSGAN是通过基于距离惩罚那些离决策面远的那些假样本，所以具有更多的梯度用于训练迭代。

技术分享图片

图0.2 两个损失函数的函数图
如图0.2所示，最小二乘损失函数只有一个点是平的，而sigmoid交叉熵函数会当x变得足够大时就饱和了。

1. LSGAN

1.1 目标函数

如上面所述，之前的目标函数为：

技术分享图片

xudon mao等人提出的目标函数为：
技术分享图片

技术分享图片

其中a，b，c满足条件:\($b-c=1\) 并且 \(b-a=2\)。
所以他们推荐了两种参数的选择：
技术分享图片

技术分享图片

技术分享图片

1.2 网络结构

xudon mao等人参考了vgg的网络结构，将LSGAN的生成器和判别器的网络结构设置成：

技术分享图片

上述网络结构的生成器灵感来自VGG结构，其中激活函数沿用了DCGAN的ReLU用于生成器，LeakyReLU用于判别器。

而且，他们在如何将GAN用于多类图片生成上也做了一些工作，如生成3740类的中文文字图片，这时候，自然灵感来自于条件GAN。所以，此时的网络结构不同于上面：

技术分享图片

在进行多类别生成的时候，如果直接将one-hot的很长向量作为条件gan的输入，那么会导致内存损耗和时间损耗，所以在输入到网络之前，先通过一个线性映射层将one-hot映射成一个较小维度的向量，比如上面的256。此时对应的目标函数自然为：
技术分享图片

技术分享图片

其中\(y\)为one-hot向量

2. 实验结果

xudon mao等人还做了一些实验用于验证LSGAN的训练稳定性，如图

技术分享图片

图2.1 关于BN和迭代器的稳定性验证
技术分享图片

技术分享图片

图2.2 基于高斯混合分布数据集的对比，此时生成器和判别器都有三层fc层
技术分享图片

技术分享图片

图2.3 生成中文字符图片

Generative Adversarial Nets[LSGAN]

标签：数据生成最小 math sar cross 并且文字函数

原文地址：https://www.cnblogs.com/shouhuxianjian/p/8467845.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！