DCGAN生成动漫头像（附代码）

2023-11-08

DCGAN。顾名思义，就是深度卷积生成对抗神经网络，也就是引入了卷积的，但是它用的是反卷积，就是卷积的反操作。

我们看看DCGAN的图：

生成器开始输入的是噪声数据，然后经过一个全连接层，再把全连接层的输出reshape，然后经过反卷积，

判别器就是卷积层，最后一个全连接层，用sigmoid激活函数。

DCGAN注意事项：

生成器的全部激活函数用relu，除了最后一层用tanh函数

判别器的激活函数都是LeakyRelu，最后一层是sigmoid、

生成器和判别器都是用BN层，

在判别器中只需要一层全连接层用于最后的分类，不要接太多，一个就好

训练的时候需要将原始输入图像resize到[-1,1]

生成器最后一层不使用BN层，判别器第一层不使用BN层

然后将下DCGAN的网络结构：

首先是生成网络：

第一层：全连接层，输出神经元个数64×8×图像长×图像宽，这个地方的长和宽是要原始图片反推过来的，然后reshape成[batch_size,图像长,图像宽,64×8],然后接着relu激活函数

第二层：反卷积层(deconv),卷积核大小[5,5],步长2,权重使用高斯分布，同时权重的初始化标准差stddev=0.02，输出通道数64×4，后面接BN层，然后使用relu作为激活函数

第三层：也是反卷积层，参数和上面的一样，输出通道数是64×2，也是BN加relu

第四层：也是反卷积层，参数和上面的一样，输出通道数是64×1，也是BN加relu

第五层：反卷积层，输出通道数为3,后面接relu(没有BN层)

判别器：

第一层：卷积层，卷积核大小：[5,5],权重初始化使用高斯分布，标准差为 stddev=0.02，输出的通道数为64,然后接LeakyRelu，相当于tf.maximum(x*0.2,x),使用斜率为0.2，没有BN层

第二层：卷积层，卷积核大小：[5,5],权重初始化使用高斯分布，标准差为stddev=0.02，输出的通道数为64×2,然后接BN层，然后是LeakyRelu，相当于tf.maximum(x*0.2,x),使用斜率为0.2

第三层：卷积层，卷积核大小：[5,5],权重初始化使用高斯分布，标准差为stddev=0.02，输出的通道数为64×4,然后接BN层，BN层后面是LeakyRelu，相当于tf.maximum(x*0.2,x),使用斜率为0.2

第四层：卷积层，卷积核大小：[5,5],权重初始化使用高斯分布，标准差为 stddev=0.02，输出的通道数为64×8,然后接BN层，BN层后面是LeakyRelu，相当于tf.maximum(x*0.2,x),使用斜率为0.2

然后是将第四层的输出reshape，拉平，

第五层：全连接层，输出神经元个数1,卷积核大小：[5,5],权重初始化使用高斯分布，标准差为stddev=0.02，

然后看我实现的代码：

导入相关的库

import matplotlib.pyplot as plt
import tensorflow as tf
from scipy import misc
import os
import numpy as np
%matplotlib inline

这个是显示图片，方便训练过程中查看

def vis_img(batch_size,samples):
    fig,axes = plt.subplots(figsize=(7,7),nrows=8,ncols=8,sharey=True,sharex=True)

    for ax,img in zip(axes.flatten(),samples[batch_size]):
        #print(img.shape)


        ax.xaxis.set_visible(False)
        ax.yaxis.set_visible(False)
        im = ax.imshow(img.reshape((32, 32,3)), cmap='Greys_r')
    plt.show()
    return fig, axes

得到batch

import os
from scipy import misc
import numpy as np
def read_img(path):

    img = misc.imresize(misc.imread(path),size=[32,32])
    return img

def get_batch(path,batch_size):
    img_list = [os.path.join(path,i) for i in os.listdir(path)]
    
    n_batchs = len(img_list)//batch_size
    img_list = img_list[:n_batchs*batch_size]

    for ii in range(n_batchs):
        tmp_img_list = img_list[ii*batch_size:(ii+1)*batch_size]
        img_batch = np.zeros(shape=[batch_size, 32, 32, 3])
        for jj,img in enumerate(tmp_img_list):
            img_batch[jj] = read_img(img)
        yield img_batch

构建生成网络

def generator(inputs,stddev=0.02,alpha=0.2,name='generator',reuse=False):


    with tf.variable_scope(name,reuse=reuse) as scope:


        fc1 = tf.layers.dense(gen_input,64*8*6*6,name='fc1')
        re1 = tf.reshape(fc1, (-1, 6, 6, 512),name='reshape')
        bn1 = tf.layers.batch_normalization(re1,name='bn1')
        #ac1 = tf.maximum(alpha * bn1, bn1,name='ac1')
        ac1 = tf.nn.relu(bn1,name='ac1')


        de_conv1 = tf.layers.conv2d_transpose(ac1,256,kernel_size=[5,5],padding='same',strides=2,kernel_initializer=tf.random_normal_initializer(stddev=stddev),name='decov1')
        bn2 = tf.layers.batch_normalization(de_conv1,name='bn2')
        #ac2 = tf.maximum(alpha * bn2, bn2,name='ac2')
        ac2 = tf.nn.relu(bn2,name='ac2')


        de_conv2 = tf.layers.conv2d_transpose(ac2, 128, kernel_size=[5, 5],padding='same',kernel_initializer=tf.random_normal_initializer(stddev=stddev),strides=2, name='decov2')
        bn3 = tf.layers.batch_normalization(de_conv2,name='bn3')
        #ac3 = tf.maximum(alpha * bn3, bn3,name='ac3')
        ac3 = tf.nn.relu(bn3,name='ac3')


        de_conv3 = tf.layers.conv2d_transpose(ac3, 64, kernel_size=[5, 5],padding='same',kernel_initializer=tf.random_normal_initializer(stddev=stddev), strides=2, name='decov3')
        bn4 = tf.layers.batch_normalization(de_conv3,name='bn4')
        #ac4 = tf.maximum(alpha * bn4, bn4,name='ac4')
        ac4 = tf.nn.relu(bn4,name='ac4')


        logits = tf.layers.conv2d_transpose(ac4, 3, kernel_size=[5, 5], padding='same',kernel_initializer=tf.random_normal_initializer(stddev=stddev), strides=2,name='logits')


        output = tf.tanh(logits)


        return output

构建判别网络：

def discriminator(inputs,stddev=0.02,alpha=0.2,batch_size=64,name='discriminator',reuse=False):
    with tf.variable_scope(name,reuse=reuse) as scope:

        conv1 = tf.layers.conv2d(inputs,64,(5,5),(2,2),padding='same',kernel_initializer=tf.random_normal_initializer(stddev=stddev),name='conv1')

        ac1 = tf.maximum(alpha*conv1,conv1,name='ac1')
        

        conv2 = tf.layers.conv2d(ac1, 128, (5,5), (2, 2), padding='same',
                                 kernel_initializer=tf.random_normal_initializer(stddev=stddev), name='conv2')
        bn2 = tf.layers.batch_normalization(conv2, name='bn2')
        ac2 = tf.maximum(alpha * bn2, bn2, name='ac2')
        

        conv3 = tf.layers.conv2d(ac2, 256, (5,5), (2, 2), padding='same',
                                 kernel_initializer=tf.random_normal_initializer(stddev=stddev), name='conv3')
        bn3 = tf.layers.batch_normalization(conv3, name='bn3')
        ac3 = tf.maximum(alpha * bn3, bn3, name='ac3')
  

        conv4 = tf.layers.conv2d(ac3, 512, (5,5), (2, 2), padding='same',
                               kernel_initializer=tf.random_normal_initializer(stddev=stddev), name='conv4')
        bn4 = tf.layers.batch_normalization(conv4, name='bn4')
        ac4 = tf.maximum(alpha * bn4, bn4, name='ac4')

        flat = tf.reshape(ac4,shape=[batch_size,6*6*512],name='reshape')

        fc2 = tf.layers.dense(flat, 1, kernel_initializer=tf.random_normal_initializer(stddev=stddev), name='fc2')
        return fc2
lr = 0.0002
epochs = 100
batch_size = 64

alpha = 0.2
with tf.name_scope('gen_input') as scope:
    gen_input = tf.placeholder(dtype=tf.float32,shape=[None,100],name='gen_input')

with tf.name_scope('dis_input') as scope:
    real_input = tf.placeholder(dtype=tf.float32,shape=[None,96,96,3],name='dis_input')
    


gen_out = generator(gen_input,stddev=0.02,alpha=alpha,name='generator',reuse=False)

real_logits = discriminator(real_input,alpha=alpha,batch_size=batch_size)
fake_logits = discriminator(gen_out,alpha=alpha,reuse=True)



#var_list_gen = tf.get_collection(tf.GraphKeys.TRAINABLE_VARIABLES,scope='generator')
#var_list_dis = tf.get_collection(tf.GraphKeys.TRAINABLE_VARIABLES,scope='discriminator')
train_var = tf.trainable_variables()
var_list_gen = [var for var in train_var if var.name.startswith('generator') ]
var_list_dis = [var for var in train_var if var.name.startswith('discriminator')]
with tf.name_scope('metrics') as scope:
    loss_g = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(labels=tf.ones_like(fake_logits)*0.9,logits=fake_logits))
    loss_d_f = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(labels=tf.zeros_like(fake_logits),logits=fake_logits))
    loss_d_r = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(labels=tf.ones_like(real_logits)*0.9,logits=real_logits))
    loss_d = loss_d_f + loss_d_r
    gen_optimizer = tf.train.AdamOptimizer(0.0002,beta1=0.5).minimize(loss_g,var_list=var_list_gen)
    dis_optimizer = tf.train.AdamOptimizer(0.0002,beta1=0.5).minimize(loss_d, var_list=var_list_dis)

训练神经网络：

with tf.Session() as sess:
    
    sess.run(tf.global_variables_initializer())
    
    coord = tf.train.Coordinator()
    threads = tf.train.start_queue_runners(sess=sess, coord=coord)
    writer = tf.summary.FileWriter('./graph/DCGAN',sess.graph)
    saver = tf.train.Saver()

       
    for epoch in range(epochs):
        total_g_loss = 0
        total_d_loss = 0
        KK = 0
        for batch in get_batch('./faces/',batch_size):

            x_real = batch
            x_real = x_real/127.5 - 1
            x_fake = np.random.uniform(-1,1,size=[batch_size,100])
            
            KK += 1
        

            _,tmp_loss_d= sess.run([dis_optimizer,loss_d],feed_dict={gen_input:x_fake,real_input:x_real})
         
            total_d_loss += tmp_loss_d

            _, tmp_loss_g = sess.run([gen_optimizer,loss_g],feed_dict={gen_input:x_fake})
            _, tmp_loss_g = sess.run([gen_optimizer,loss_g],feed_dict={gen_input:x_fake})
            total_g_loss += tmp_loss_g

        if epoch % 10 == 0:
            
            x_fake = np.random.uniform(-1,1,[64,100])

            samples = sess.run(gen_out,feed_dict={gen_input:x_fake})
            samples = (((samples - samples.min()) * 255) / (samples.max() - samples.min())).astype(np.uint8)
            
            vis_img(-1, [samples])
            
            print('epoch {},loss_g={}'.format(epoch, total_g_loss/2/KK))
            print('epoch {},loss_d={}'.format(epoch, total_d_loss/KK))

    writer.close()
    saver.save(sess, "./checkpoints/DCGAN")

结果展示：

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

深度学习

tensorflow

DCGAN生成动漫头像（附代码）的相关文章

Tensorflow 初始化给出所有 1

张量流1 12 0 在下面的代码片段中 wrapped rv val和seq rv val似乎应该是等效的但事实并非如此相反 seq rv val 被正确初始化为随机生成的 init val 数组但wrapped rv val 设置为
导入一个简单的 Tensorflow freeze_model.pb 文件并用 C++ 进行预测

我正在尝试将从 Tensorflow Python 导出的图形导入到 Tensorflow C 中我已经成功地将图表重新导入到 Python 中我现在唯一想要的就是用 C 编写相同的代码但我不确定 C api 函数和用法因为 Ten
每次运行神经网络代码时结果都会改变

我通过运行此链接中提供的代码得到了结果神经网络预测多个变量的值 https stackoverflow com questions 58071836 neural network predicting values of multiple
如何在 Tensorflow 对象检测 api 中评估预训练模型

尝试使用最近发布的 Tensorflow 对象检测 API 并且想知道如何评估他们在模型动物园中提供的预训练模型之一前任如何获取该预训练模型的 mAP 值自从script https github com tensorflow mod
如何将张量推送到 TensorFlow 队列并从另一个进程中提取它们？

我有一个 TensorFlow 集群已启动并正在运行我正在尝试使用一个客户端进程将数据入队并将其从另一进程中出队我无法让它工作我做错了什么这是我的推送数据的程序 queue push py import tensorflow as
无法从 DenseVariational 获得合理的结果

我正在尝试使用以下大小的数据集正弦曲线进行回归问题500 首先我尝试使用 2 个密集层每个层有 10 个单元 model tf keras Sequential tf keras layers Dense 10 activation
Keras，如何获取每一层的输出？

我已经用 CNN 训练了一个二元分类模型这是我的代码 model Sequential model add Convolution2D nb filters kernel size 0 kernel size 1 border mode
在 keras 中使用条件实现自定义损失函数

我需要一些有关 keras 损失函数的帮助我一直在使用 Tensorflow 后端在 keras 上实现自定义损失函数我已经在 numpy 中实现了自定义损失函数但如果它可以转换为 keras 损失函数那就太好了损失函数采用数据帧
如何正确将 tflite_graph.pb 转换为 detector.tflite

我正在使用tensorflow对象检测API使用tensorflow中的ssdlite mobilenet v2 coco 2018 05 09来训练自定义模型模型动物园 https github com tensorflow models
如何清除 tf.flags？

如果我运行此代码两次 tf flags DEFINE integer batch size 2 batch size for training 我会得到这个错误 DuplicateFlagError The flag batch size
TensorFlow 中的 global_step 是什么意思？

在这就是教程代码 https github com tensorflow tensorflow blob master tensorflow examples tutorials mnist mnist py来自 TensorFlow 网站
如何访问 tf.layers.conv2d 中的内核变量？

我想可视化卷积层中的权重以观察它们如何变化但我找不到一种方法来访问卷积层中的权重tf layers conv2d 谢谢您可以通过名称访问该变量 weights sess run
从图中删除节点或重置整个默认图

使用默认全局图时是否可以在添加节点后将其删除或者将默认图重置为空当我在 IPython 中交互地使用 TF 时我发现自己必须反复重新启动内核如果可能的话我希望能够更轻松地尝试图表更新 11 2 2016 tf reset de
如何在带有 LSTM 层的 TensorFlow Hub 中使用嵌入模型？

我正在学习 TensorFlow 2 通过 TF Hub 教程进行文本分类它使用了 TF hub 的嵌入模块我想知道是否可以修改模型以包含 LSTM 层这是我尝试过的 train data validation data test d
如何将 std::vector 转换为张量而不在 C++ 中的张量流中进行复制？

在c 中多维矩阵存储在std vector
用于测试张量流安装的速度基准

我怀疑我的 GPU 机器上是否正确配置了张量流因为在我精美的 GPU 机器上训练一个简单的线性回归模型批量大小 32 1500 个输入特征 150 个输出变量的每次迭代速度比在笔记本电脑上慢 100 倍我使用的是 Titan X 配
Tensorflow如何生成不平衡组合数据集

我对新数据集 API tensorflow 1 4 有疑问我有两个数据集我需要创建一个组合的不平衡数据集即每个批次应包含第一个数据集中一定数量的元素和第二个数据集中一定数量的元素例如 dataset1 tf data Datase
从字符串列表创建 TfRecords 并在解码后在张量流中提供图形

目的是创建 TfRecords 数据库给定我有 23 个文件夹每个文件夹包含 7500 个图像以及 23 个文本文件每个文件有 7500 行描述单独文件夹中 7500 个图像的特征我通过以下代码创建了数据库 import ten
Tensorboard——High-level节点的计算时间与其子节点计算时间的总和不同

继tutorial https www tensorflow org programmers guide graph viz在 TensorFlow 上我试图使用张量板来理解运行时统计数据我发现代表名称范围的高级节点的计算时间不等于其子
安装后 Anaconda 提示损坏

我刚刚安装张量流GPU创建单独的后环境按照以下指示here https github com antoniosehk keras tensorflow windows installation 但是安装后当我关闭提示窗口并打开新航站楼弹出

随机推荐

人脸识别对齐，向量搜索

人脸对齐的概念 1 查找人脸我们可以使用dlib来查找人脸也就是所谓的侦测人脸可以从下面github的地址去拿到models 人脸查找的models dnnFaceDetector dlib cnn face detection mo
#cmakedefine真实含义

cmakedefine 用于configure file 中用于生成头文件的文件中只有当CMakeLists txt中的同名变量为真时才会在生成的头文件中定义区别于 define无论何时都会定义
中介者模式-C++实现

跟我在公司搭的框架好像 MediatorPattern cpp 定义控制台应用程序的入口点 include stdafx h include
buck变换器设计matlab_开关电源控制环路设计，非常实用！

欢迎加入技术交流QQ群 2000人电力电子技术与新能源 1105621549 高可靠新能源行业顶尖自媒体在这里有电力电子新能源干货行业发展趋势分析最新产品介绍众多技术达人与您分享经验欢迎关注微信公众号电力电子技术与新能源 M
RichErp - vue 使用总结 - data 和 props

data仅代表自己的内部的状态数据所以如果一个Component仅仅是自身改变状态然后把状态反馈给外界的话理论上说只用data就可以了显然组件通常不会这样而是需要一种可进可出的状态也就是允许外界对组件内部的数据进行修改同时组件
R语言的pairs函数和ggpairs函数在数据可视化中扮演着重要的角色，能够实现散点图矩阵图的可视化

R语言的pairs函数和ggpairs函数在数据可视化中扮演着重要的角色能够实现散点图矩阵图的可视化本文将介绍这两个函数的用法并通过源代码演示如何使用它们进行数据可视化 1 R语言的pairs函数 pairs函数是R语言中一个强大的数
React 进阶: useSyncExternalStore API 外部状态管理

React 进阶 useSyncExternalStore API 外部状态管理文章目录 React 进阶 useSyncExternalStore API 外部状态管理完整代码示例动机关于状态的思考方案一自行接入外部状态外部
分类器概念篇

分类器是数据挖掘中对样本进行分类的方法的统称包含决策树逻辑回归朴素贝叶斯神经网络等分类器的构造和实施大体会经过以下几个步骤选定样本包含正样本和负样本将所有样本分成训练样本和测试样本两部分在训练样本上执行分类器算法生成分类
以违停检测为示例的利用微软云AIOT技术加速项目落地

AIoT即融合了AI 人工智能和IoT 物联网的技术图形图像处理是人工智能领域中重要的一个分支在日常生活中也存在大量基于图形图像的处理的场景比如交通违章抓拍基于视觉的司机防疲劳监测家用摄像机的老人摔倒报警等功能对于物联网则在
Kafka消息分区&producer拦截器&无消息丢失（八）

上篇文章说了 acks 1代表什么都不管即使配置了回调也不会起作用 0代表不会等待replic副本里的不会持久化只要broker leader持久化成功则返回给producer 1代表all 则表示全部持久化成功才返回成功给produc
dubbo分布式日志跟踪

dubbo分布式日志追踪需要修改两个地方一个是consumer端的 InvokerInvocationHandler java 红色是修改的地方 public class InvokerInvocationHandler impleme
微服务项目打包时指定jar包复制到同一文件夹下

转载于原文在项目最外层pom文件中指定文件存放位置
密码学技术如何选型？再探工程能力边界的安全模型｜第5论

作者李昊轩来源微众银行区块链牢不可破的密码学算法也怕物理攻击物理信号泄露为何会威胁到隐私保护的效果隐私保护方案对部署环境有何讲究不可信执行环境下如何设计隐私保护方案这里我们将继续安全模型的分析由隐私保护技术方案中理论层面
JMeter 测试脚本编写技巧

是一款开源软件用于进行负载测试性能测试及功能测试测试人员可以使用 JMeter 编写测试脚本模拟多种不同的负载情况从而评估系统的性能和稳定性以下是编写 JMeter 测试脚本的步骤第 1 步创建测试计划在JMeter中测
java 下mp3 转 pcm、wav

mp3 转 pcm wav 由于MP3直接转为wav 容易出现文件大小为0k 时间缩短等问题这里是通过先将mp3转成pcm 然后在通过pcm转成wav 下面直接上代码先引入所需要的jar包
CentOS系统安装libssl-dev时No package libssl-dev availab

libssl dev是ubuntu系统的库而centos系统对应的是openssl devel centos中运行yum install openssl devel ubuntu系统运行apt get install libssl dev
7.2 IDEA 没有Java EE

方法二第一步正常创建一个新的New Project 创建完成后选择项目包 gt 点击右键 gt 点击Add Framework Support 然后勾选Web Application 4 之后点击OK确认即可完美的创建了JavaEE
C#断点续传的实现示例

断点续传是一种可以在文件传输过程中出现断电网络故障等情况时能够保证传输内容不会全部丢失而是可以从已传输的位置继续传输的机制在文件传输较大较复杂的情况下使用断点续传可以提高传输质量稳定性和效率在C 中可以使用HTTP协议的R
蓝桥杯2021年第十二届真题第二场-国际象棋

题目题目描述众所周知八皇后问题是求解在国际象棋棋盘上摆放 8 8 8 个皇后使得两两之间互不攻击的方案数已经学习了很多算法的小蓝觉得八皇后问题太简单了意犹未尽作为一个国际象棋迷他想研究在 N M
DCGAN生成动漫头像（附代码）

DCGAN 顾名思义就是深度卷积生成对抗神经网络也就是引入了卷积的但是它用的是反卷积就是卷积的反操作我们看看DCGAN的图生成器开始输入的是噪声数据然后经过一个全连接层再把全连接层的输出reshape 然后经过反卷积判别器

DCGAN生成动漫头像（附代码）

DCGAN生成动漫头像（附代码） 的相关文章

随机推荐

热门标签

DCGAN生成动漫头像（附代码）的相关文章