Variational Auto-encoder(VAE)变分自编码器-Pytorch

2023-10-27

import os
import torch
import torch.nn as nn
import torch.nn.functional as F
import torchvision
from torchvision import transforms
from torchvision.utils import save_image

# 配置GPU或CPU设置
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

# 创建目录
# Create a directory if not exists
sample_dir = 'samples'
if not os.path.exists(sample_dir):
    os.makedirs(sample_dir)

# 超参数设置
# Hyper-parameters
image_size = 784
h_dim = 400
z_dim = 20
num_epochs = 15
batch_size = 128
learning_rate = 1e-3

# 获取数据集
# MNIST dataset
dataset = torchvision.datasets.MNIST(root='./data',
                                     train=True,
                                     transform=transforms.ToTensor(),
                                     download=True)

# 数据加载，按照batch_size大小加载，并随机打乱
data_loader = torch.utils.data.DataLoader(dataset=dataset,
                                          batch_size=batch_size,
                                          shuffle=True)

# 定义VAE类
# VAE model
class VAE(nn.Module):
    def __init__(self, image_size=784, h_dim=400, z_dim=20):
        super(VAE, self).__init__()
        self.fc1 = nn.Linear(image_size, h_dim)
        self.fc2 = nn.Linear(h_dim, z_dim)
        self.fc3 = nn.Linear(h_dim, z_dim)
        self.fc4 = nn.Linear(z_dim, h_dim)
        self.fc5 = nn.Linear(h_dim, image_size)

    # 编码  学习高斯分布均值与方差
    def encode(self, x):
        h = F.relu(self.fc1(x))
        return self.fc2(h), self.fc3(h)

    # 将高斯分布均值与方差参数重表示，生成隐变量z  若x~N(mu, var*var)分布,则(x-mu)/var=z~N(0, 1)分布
    def reparameterize(self, mu, log_var):
        std = torch.exp(log_var / 2)
        eps = torch.randn_like(std)
        return mu + eps * std
    # 解码隐变量z
    def decode(self, z):
        h = F.relu(self.fc4(z))
        return F.sigmoid(self.fc5(h))

    # 计算重构值和隐变量z的分布参数
    def forward(self, x):
        mu, log_var = self.encode(x)# 从原始样本x中学习隐变量z的分布，即学习服从高斯分布均值与方差
        z = self.reparameterize(mu, log_var)# 将高斯分布均值与方差参数重表示，生成隐变量z
        x_reconst = self.decode(z)# 解码隐变量z，生成重构x’
        return x_reconst, mu, log_var# 返回重构值和隐变量的分布参数

# 构造VAE实例对象
model = VAE().to(device)
print(model)
# VAE(  (fc1): Linear(in_features=784, out_features=400, bias=True)
#       (fc2): Linear(in_features=400, out_features=20, bias=True)
#       (fc3): Linear(in_features=400, out_features=20, bias=True)
#       (fc4): Linear(in_features=20, out_features=400, bias=True)
#       (fc5): Linear(in_features=400, out_features=784, bias=True))

# 选择优化器，并传入VAE模型参数和学习率
optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)
#开始训练
for epoch in range(num_epochs):
    for i, (x, _) in enumerate(data_loader):
        # 前向传播
        x = x.to(device).view(-1, image_size)# 将batch_size*1*28*28 ---->batch_size*image_size  其中，image_size=1*28*28=784
        x_reconst, mu, log_var = model(x)# 将batch_size*748的x输入模型进行前向传播计算,重构值和服从高斯分布的隐变量z的分布参数（均值和方差）

        # 计算重构损失和KL散度
        # Compute reconstruction loss and kl divergence
        # For KL divergence, see Appendix B in VAE paper or http://yunjey47.tistory.com/43
        # 重构损失
        reconst_loss = F.binary_cross_entropy(x_reconst, x, size_average=False)
        # KL散度
        kl_div = - 0.5 * torch.sum(1 + log_var - mu.pow(2) - log_var.exp())

        # 反向传播与优化
        # 计算误差(重构误差和KL散度值)
        loss = reconst_loss + kl_div
        # 清空上一步的残余更新参数值
        optimizer.zero_grad()
        # 误差反向传播, 计算参数更新值
        loss.backward()
        # 将参数更新值施加到VAE model的parameters上
        optimizer.step()
        # 每迭代一定步骤，打印结果值
        if (i + 1) % 10 == 0:
            print ("Epoch[{}/{}], Step [{}/{}], Reconst Loss: {:.4f}, KL Div: {:.4f}"
                   .format(epoch + 1, num_epochs, i + 1, len(data_loader), reconst_loss.item(), kl_div.item()))

    with torch.no_grad():
        # Save the sampled images
        # 保存采样值
        # 生成随机数 z
        z = torch.randn(batch_size, z_dim).to(device)# z的大小为batch_size * z_dim = 128*20
        # 对随机数 z 进行解码decode输出
        out = model.decode(z).view(-1, 1, 28, 28)
        # 保存结果值
        save_image(out, os.path.join(sample_dir, 'sampled-{}.png'.format(epoch + 1)))

        # Save the reconstructed images
        # 保存重构值
        # 将batch_size*748的x输入模型进行前向传播计算，获取重构值out
        out, _, _ = model(x)
        # 将输入与输出拼接在一起输出保存  batch_size*1*28*（28+28）=batch_size*1*28*56
        x_concat = torch.cat([x.view(-1, 1, 28, 28), out.view(-1, 1, 28, 28)], dim=3)
        save_image(x_concat, os.path.join(sample_dir, 'reconst-{}.png'.format(epoch + 1)))

大概长这么个样子：

附上一张结果图：

转载于:https://www.cnblogs.com/jeshy/p/11437547.html

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

人工智能

python

Variational Auto-encoder(VAE)变分自编码器-Pytorch 的相关文章

“扩展”numpy ndarray 的好方法？

有没有扩展 numpy ndarray 的好方法假设我有一个像这样的 ndarray 1 2 3 4 我希望每行通过填充零来包含更多元素 1 2 0 0 0 3 4 0 0 0 我知道一定有一些蛮力的方法可以做到这一点比如构造一个带有
Tastypie 与 application/x-www-form-urlencoded

我有点难以弄清楚下一步应该做什么我正在使用 tastypie 为我的 Web 应用程序创建 API 从另一个应用程序特别是 ifbyphone com 我收到一个没有标题的 POST 如下所示 post data http myapp
如何在 Python 中使用 .format() 打印“for”循环中的列表？

我是 Python 新手我正在编写一段非常简单的代码使用 for 循环打印列表的内容 format 我想要如下的输出但我收到此错误 names David Peter Michael John Bob for i in names p
如何在 Django Admin 的“更改”页面中显示内嵌上传的图像？

我正在尝试在中显示内联上传的图像变更列表页面在 Django 管理中这是我的代码如下 models py from django db import models class Product models Model name mod
AttributeError：模块“tensorflow.python.framework.ops”没有属性“RegisterShape”

我正在使用 TensorFlow 2 1 0 dev20191125 不幸的是我无法编译一个带有错误的简单示例 AttributeError 模块 tensorflow python framework ops 没有属性 Registe
插入多行并返回主键时 Sqlalchemy 的奇怪行为

插入多行并返回主键时我注意到一些奇怪的事情如果我在 isert 查询中添加使用参数值我会得到预期的行为但是当将值传递给游标时不会返回任何内容这可能是一个错误还是我误解了什么我的sqlachemy版本是0 9 4 下面如何重现错
使用解析将 ** 运算符更改为幂函数？

我的要求是将运算符更改为幂函数例如 1 Input B 2 Output power B 2 2 B 2 T 2 X Output power B 2 我写了下面的正则表达式来解决这个问题 rx r a zA Z0 9 a zA Z0
为什么具有复杂无穷大的 NumPy 运算会导致有趣的结果？

我注意到复杂的无穷大的有趣结果 In 1 import numpy as np In 2 np isinf 1j np inf Out 2 True In 3 np isinf 1 1j np inf Out 3 True In 4 np
代码 zip( *sorted( zip(units, error) ) ) 的作用是什么？

对于我的申请units and errors始终是数值列表我尝试用谷歌搜索每个部分的作用并找出了 zip 的第一部分它似乎 ziped list zip units errors 只需将单位和误差配对即可生成一个列表如下所示 uni
创建一个行为类似于任何变量但具有更改/读取回调的类

我想创建一个类其行为类似于 python 变量但在更改读取变量时调用一些回调函数换句话说我希望能够按如下方式使用该类 x myClass change callback read callback 将 x 定义为 myclas
Python 3.4.3 subprocess.Popen 在没有管道的情况下获取命令的输出？

我试图将命令的输出分配给变量而不让命令认为它正在通过管道传输原因是如果正在通过管道传输则相关命令会给出未格式化的文本作为输出但如果从终端运行则会给出颜色格式化的文本我需要获取这种颜色格式的文本到目前为止我已经尝试了一些事情
计算 for 循环期间的运行总计 - Python

编辑下面是我根据收到的反馈答案编写的工作代码这个问题源于我之前使用 MIT 的开放课件学习 Python CS 时提出的问题在这里查看我之前的问题 https stackoverflow com questions 4990159
如何解决错误 EGL 驱动程序消息（错误）eglQueryDeviceAttribEXT：使用 Selenium 和 Python 的错误属性

我从 selenium 收到随机错误消息即使它们都与我正在运行的确切 Web 驱动程序命令无关据我所知此错误不会中断程序它只是添加不需要的警报使我的打印件难以阅读 Chrome 版本 75 0 3770 100 官方版本 64 位
Mac 上的 Errno 13 权限被拒绝

我只是测试如何从一个 py 文件调用外部 py 文件我有 2 个 py 文件都在同一目录中这是主要代码 runext py 假设调用 ext py import subprocess subprocess call Users tra
如何使用 Python Pandas 制作 DataFrame 切片并在特定切片中“fillna”？

问题让我们从 Kaggle 获取泰坦尼克号数据集我有包含 Pclass 性别和年龄列的数据框我需要用特定组的中位数填充年龄列中的 NaN 如果是来自一等的女性我想用一等女性的中位数填写她的年龄而不是整个年龄列的中位数问
Python：如何使用生成器来避免 sql 内存问题

我有以下方法来访问 mysql 数据库并且查询在服务器中执行我无权更改有关增加内存的任何内容我对生成器很陌生并开始阅读更多有关它的内容并认为我可以将其转换为使用生成器 def getUNames self globalUserQu
Numba jitclass 不适用于 python 列表

我在用python 3 6 and numba 0 36 这个问题有一个sister https stackoverflow com questions 48159360 numba custom stack class and pop f
有效积累稀疏 scipy 矩阵的集合

我有一个 O N NxN 的集合scipy sparse csr matrix 每个稀疏矩阵都有 N 个元素集我想将所有这些矩阵加在一起以获得一个常规的 NxN numpy 数组 N 约为 1000 矩阵内非零元素的排列使得所得总和肯定不
Scrapy - 持续从数据库中获取要爬取的url

我想不断地从数据库中获取要爬行的网址到目前为止我成功地从基地获取了 url 但我希望我的蜘蛛继续从该基地读取因为该表将由另一个线程填充我有一个管道一旦爬行工作就会从表中删除 url 换句话说我想使用我的数据库作为队列我尝试
无法在 Python 2.4 中解码 unicode 字符串

这是Python 2 4 中的这是我的情况我从数据库中提取一个字符串它包含一个变音的 o xf6 此时如果我运行 type value 它会返回 str 然后我尝试运行 decode utf 8 但收到错误 utf8 编解码器无法解

随机推荐

文本处理——基于 word2vec 和 CNN 的文本分类：综述 & 实践（一）

原文地址 https zhuanlan zhihu com p 29076736 导语传统的向量空间模型 VSM 假设特征项之间相互独立这与实际情况是不相符的为了解决这个问题可以采用文本的分布式表示方式例如 word embedd
ohmyzsh主题修改

1 选择主题 ohmyzsh Themes by Github 2 修改zsh配置 vim zshrc 3 使配置生效 source zshrc 效果如下
二、初识arduino uno开发板

开发板参数表什么是arduino Arduino是一款便捷灵活方便上手的开源电子原型平台包含硬件各种型号的Arduino板和软件 ArduinoIDE 构建于开放原始码simple I O介面版并且具有使用类似Java C语言的
Golang闭包陷阱

golang闭包陷阱本质原理其实是range陷阱 Golang for range陷阱 ep 1 func main var values int 1 2 3 4 5 for value range values go func fmt P
编译 OneFlow 模型

本篇文章译自英文文档 Compile OneFlow Models tvm 0 14 dev0 documentation 作者是 BBuf Xiaoyu Zhang GitHub 更多 TVM 中文文档可访问 Apache TVM 是一个
3月6日服务器例行维护公告,2014年3月6日停机维护公告

亲爱的玩家为了保证服务器的稳定和服务质量新大话西游2 将于2014年3月6日早上8 00停机进行每周例行的维护工作维护时间为早上08 00至09 30 同时本次停机还将发布最新的客户端补丁 patch2 0 476 如果在维护期间
Java高级编程——多线程（JDK5新增创建线程方式Callable，线程池）

创建线程的第三四种方式一实现Callable接口 1 1与Runnable相比 1 2实现步骤创建Callable接口实现类重写call方法新建实现类对象将实现类对象作为参数传递待FutureTask的构造器中创建Futur
使用redis进行用户接口访问时间次数限制

使用redis进行用户接口访问时间次数限制假设一个用户用IP判断每分钟访问某一个服务接口的次数不能超过10次 import org apache commons lang3 StringUtils import org slf4j L
Android Studio一直Waiting for build to finish

今天安卓的gradle文件出现问题所以将C Users Administrator gradle删除接下来出现下图的问题这是由于安卓缺少gradle文件图片来自https blog csdn net Hanghang article
手撕yolo3系列——详解主干网络darknet53代码（详细注释）

完整代码百度云直达链接包含预训练权重小白注释 https pan baidu com s 1US6e93OaCYOghmF21v0UIA 提取码 z8at 参考链接注代码是大神的代码在此基础上添加了详细的小白注释方便我以后阅读
Keil调试即全速运行/断点不停的其中一个原因

平台芯片 STM32F767IGT6 环境 Keil 5 14 00 问题 keil 下载程序可以执行调试时刚进调试就上电运行打断点不停但是程序正常在跑可以单步调试原因 Jlink硬件版本和驱动的问题解决之前电脑使用stm3
image.shape[0],image.shape[1],image.shape[2]

import cv2 image cv2 imread D shape bmp print image shape 0 print image shape 1 print image shape 2 结果 300 200 3 其中shape
mysql8.0安装之后，无法使用密码正常登陆

修改方法重置密码以下为步骤 1 以管理员身份先关闭mysql服务器 net stop mysql 删除mysql目录下data文件夹如果有就删除 2 在mysql目录下输入 mysqld initialize user mysql c
python如何判断是否为整数

python 判断是否为整数的方法 1 使用 type 函数判断代码为 type name bases dict 2 使用 isinstance 函数判断代码为 isinstance object classinfo 本教程操作环境 w
java 生成随机字母数字组合

import java util Random public class RandomTest 方法1 生成随机数字和字母组合 param length return public static String getCharAndNumr
让UE4中的TextRender永远面向摄像机，就像Billboard那样！

让UE4中的TextRender永远面向摄像机就像Billboard那样让UE4中的TextRender永远面向摄像机就像Billboard那样前言 Find Look At 函数 BillBoard 材质编程前言最近找了个兼职
socket网络编程（二）（tcp udp）

1 socket大概介绍 Socket的中文翻译过来就是套接字套接字是什么我们先来看看它的英文含义插座 Socket就像一个电话插座负责连通两端的电话进行点对点通信让电话可以进行通信端口就像插座上的孔端口不能同时被其他进程
负电压实现方法

目录方法一负压芯片实现方法二 Buck Boost电路方法方法三用Buck芯片产生出负压结论方法一负压芯片实现在电子市场或电子网站上可以很容易找到使用charge pump方式的负电压芯片但是输入的电压最高只有5 5V
中青杯数学建模竞赛是什么级别的比赛_比赛介绍

一背景介绍美国大学生数学建模竞赛 MCM ICM 由美国数学及其应用联合会主办是唯一的国际性数学建模竞赛也是世界范围内最具影响力的数学建模竞赛为现今各类数学建模竞赛之鼻祖二活动目的 MCM ICM的宗旨是鼓励大学师生对范围并不
Variational Auto-encoder(VAE)变分自编码器-Pytorch

import os import torch import torch nn as nn import torch nn functional as F import torchvision from torchvision import

Variational Auto-encoder(VAE)变分自编码器-Pytorch

Variational Auto-encoder(VAE)变分自编码器-Pytorch 的相关文章

随机推荐

热门标签