pytorch中torchvision.utils包下的save_image函数

2023-11-03

雷郭出品

函数的用途：
将NCHW的tensor以网格图的形式存储到硬盘中，该图也叫做雪碧图sprite image
如下图所示：
在这里插入图片描述
将多张图以网格的形式拼凑起来，每张图的大小是28*28，单通道
那宽高如何确定？
我们可以来看看该函数的源码

def save_image(
    tensor: Union[torch.Tensor, List[torch.Tensor]],
    fp: Union[Text, pathlib.Path, BinaryIO],
    nrow: int = 8,
    padding: int = 2,
    normalize: bool = False,
    range: Optional[Tuple[int, int]] = None,
    scale_each: bool = False,
    pad_value: int = 0,
    format: Optional[str] = None,
) -> None:
    """Save a given Tensor into an image file.

    Args:
        tensor (Tensor or list): Image to be saved. If given a mini-batch tensor,
            saves the tensor as a grid of images by calling ``make_grid``.
        fp (string or file object): A filename or a file object
        format(Optional):  If omitted, the format to use is determined from the filename extension.
            If a file object was used instead of a filename, this parameter should always be used.
        **kwargs: Other arguments are documented in ``make_grid``.
    """
    from PIL import Image
    grid = make_grid(tensor, nrow=nrow, padding=padding, pad_value=pad_value,
                     normalize=normalize, range=range, scale_each=scale_each)
    # Add 0.5 after unnormalizing to [0, 255] to round to nearest integer
    ndarr = grid.mul(255).add_(0.5).clamp_(0, 255).permute(1, 2, 0).to('cpu', torch.uint8).numpy()
    im = Image.fromarray(ndarr)
    im.save(fp, format=format)

可以看到nrow默认为8
padding默认为2
当我们的tensor形状为96* 1* 28 * 28的时候
网格的行和列对应的格子数分别为（N/nrow,nrow）
即（12，8）
对应的就是第一张图

但是实际当我去查看图片的像素大小时，由于padding的存在
像素大小并不是（12 * 28，8 * 28）
而是（12 * 28+13 * 2，8 * 28+9 * 2）

还有一点要注意，当你存储图片的时候由于总的图片数可能不能被batchsize整除
所以当雪碧图的格子数跟batchsize不对应的时候
不要犯愁
这是正常
我也是看了好几个小时才突然从下面的打印中得到的灵感

real_images的shape： torch.Size([128, 1, 28, 28])
real_images的shape： torch.Size([128, 1, 28, 28])
real_images的shape： torch.Size([128, 1, 28, 28])
real_images的shape： torch.Size([128, 1, 28, 28])
real_images的shape： torch.Size([128, 1, 28, 28])
real_images的shape： torch.Size([128, 1, 28, 28])
real_images的shape： torch.Size([128, 1, 28, 28])
real_images的shape： torch.Size([128, 1, 28, 28])
real_images的shape： torch.Size([128, 1, 28, 28])
real_images的shape： torch.Size([128, 1, 28, 28])
real_images的shape： torch.Size([96, 1, 28, 28])
real_img的shape： torch.Size([96, 784])

可以看到一开始的形状都是128
到了最后一个就变成了96
然后再次使用还是96
我就立刻想到了余数
然后我再验证6000=128 * 468+96
完美符合验证

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

雷郭出品

Pytorch

pytorch中torchvision.utils包下的save_image函数的相关文章

在 PyTorch 中原生测量多类分类的 F1 分数

我正在尝试在 PyTorch 中本地实现宏 F1 分数 F measure 而不是使用已经广泛使用的sklearn metrics f1 score https scikit learn org stable modules generat
使用 KL 散度时，变分自动编码器为每个输入 mnist 图像提供相同的输出图像

当不使用 KL 散度项时 VAE 几乎完美地重建 mnist 图像但在提供随机噪声时无法正确生成新图像当使用 KL 散度项时 VAE 在重建和生成图像时都会给出相同的奇怪输出这是损失函数的 pytorch 代码 def loss fu
一次热编码期间出现 RunTimeError

我有一个数据集其中类值以 1 步从 2 到 2 i e 2 1 0 1 2 其中 9 标识未标记的数据使用一种热编码 self one hot encode labels 我收到以下错误 RuntimeError index 1 is
在非单一维度 1 处，张量 a (2) 的大小必须与张量 b (39) 的大小匹配

这是我第一次从事文本分类工作我正在使用 CamemBert 进行二进制文本分类使用 fast bert 库该库主要受到 fastai 的启发当我运行下面的代码时 from fast bert data cls import Bert
为什么 pytorch matmul 在 cpu 和 gpu 上执行时得到不同的结果？

我试图找出 numpy pytorch gpu cpu float16 float32 数字之间的舍入差异而我发现的内容让我感到困惑基本版本是 a torch rand 3 4 dtype torch float32 b torch r
Blenderbot 微调

我一直在尝试微调 HuggingFace 的对话模型 Blendebot 我已经尝试过官方拥抱脸网站上给出的传统方法该方法要求我们使用 trainer train 方法来完成此操作我使用 compile 方法尝试了它我尝试过使用 Py
Pytorch Tensor 如何获取元素索引？ [复制]

这个问题在这里已经有答案了我有 2 个名为x and list它们的定义如下 x torch tensor 3 list torch tensor 1 2 3 4 5 现在我想获取元素的索引x from list 预期输出是一个整数 2
Pytorch GPU 使用率低

我正在尝试 pytorch 的例子https pytorch org tutorials beginner blitz cifar10 tutorial html https pytorch org tutorials beginner b
PyTorch 中的连接张量

我有一个张量叫做data形状的 128 4 150 150 其中 128 是批量大小 4 是通道数最后 2 个维度是高度和宽度我有另一个张量叫做fake形状的 128 1 150 150 我想放弃最后一个list array从第 2 维
PyTorch 中的交叉熵

交叉熵公式但为什么下面给出loss 0 7437代替loss 0 since 1 log 1 0 import torch import torch nn as nn from torch autograd import Variable
在 Pytorch 中估计高斯模型的混合

我实际上想估计一个以高斯混合作为基本分布的归一化流所以我有点被火炬困住了但是您可以通过估计 torch 中高斯模型的混合来在代码中重现我的错误我的代码如下 import numpy as np import matplotlib p
TensorFlow 相当于 PyTorch 的 Transforms.Normalize()

我正在尝试推断最初在 PyTorch 中构建的 TFLite 模型我一直在遵循PyTorch 实现 https github com leoxiaobin deep high resolution net pytorch blob 1ee
BertForSequenceClassification 是否在 CLS 向量上进行分类？

我正在使用抱脸变压器 https huggingface co transformers index html使用 PyTorch 打包和 BERT 我正在尝试进行 4 向情感分类并正在使用BertFor序列分类 https hugging
如何同时有效地运行多个 Pytorch 进程/模型？ Traceback：分页文件太小，无法完成此操作

背景我有一个非常小的网络我想用不同的随机种子进行测试该网络几乎只使用了我的 GPU 计算能力的 1 因此理论上我可以同时运行 50 个进程来同时尝试许多不同的种子 Problem 不幸的是我什至无法在多个进程中导入 pytorch 当
Huggingface 变形金刚模块未被 anaconda 识别

我正在使用 Anaconda python 3 7 Windows 10 我尝试通过安装变压器https huggingface co transformers https huggingface co transformers 在我的环境
当前向包含多个自动分级节点时，PyTorch 关于使用非完整后向挂钩的警告

最近升级后当运行 PyTorch 循环时我现在收到警告当前向包含多个自动分级节点时使用非完整后向钩子训练仍在运行并完成但我不确定应该将其放置在哪里register full backward hook功能我尝试将它添加到神经网络
没有名为“torch”或“torch.C”的模块

希望得到像我 5 这样的解释因为我已经检查了所有相关答案但没有一个有帮助我已经安装了Python 我已经安装了Pycharm 我已经安装了Anaconda 我已经安装了 Microsoft Visual Studio 我有not安装了
带有填充掩码的 TransformerEncoder

我正在尝试使用 src key padding mask 不等于 none 来实现 torch nn TransformerEncoder 想象输入的形状src 20 95 二进制填充掩码的形状为src mask 20 95 填充标记的位置
PyTorch 中的后向函数

我对 pytorch 的后向功能有一些疑问我认为我没有得到正确的输出 import numpy as np import torch from torch autograd import Variable a Variable torch
如何在 Google Colab 上安装 PyTorch v1.0.0+？

PyTorch v1 0 0 稳定版是发布于 2018 年 12 月 8 日 https github com pytorch pytorch releases tag v1 0 0成为之后7个月前宣布 https code fb com

随机推荐

UE4c++ Brush创建

前言 UE4常用的new FSlateBrush的方式与正常的SlateStyle的方式就不说了这类的文章很多这里主要仿照引擎源码加载图片的方式加加载参考源码 FTestStyle h class FMainStyle public
SpringBoot主程序运行及配置文件

主程序运行 SpringBootApplication public class SpringbootApplication public static void main String args SpringApplication run
5G 的未来

目录 5G流量 5G应用场景 VR AR MR 5G关键技术超密集组网 5G关键技术动态自组织网 SON 软件定义网络SDN SDN与NFV的深度融合 5G挑战频谱资源新业务的挑战新使用场景的挑战终端设备带来的挑战 5G面临的安
反射和多线程基础

Version 邢朋辉今日主播邢朋辉 QQ 345086739 一今日内容 1 1 课程回顾 1 2 反射是啥 1 3 进程和线程 1 4 线程的创建方式 1 5 线程的状态 1 6 线程的常用方法二课程回顾 Java的基本语法
R语言的常用的包

在学习R的时候 R的包众多很多时候对于初学者会造成很大的困扰就是不知道用什么样的包比较合适我会在不断使用R的过程中进行使用同时结合使用体验为大家推荐合适的R包避免重复学习以节约时间标了精的是需要重点研究和掌握的包 1 数据导
写CSDN博客时，调节字体、大小、颜色

字体颜色样式系列为了突出重点内容想设置不同颜色颜色挑选网址 https blog csdn net wo919191 article details 84249531 face设置字体文本内容使用font标签包裹可通过face设置
查询tomcat可用端口

步骤一 cmd输入输入 netstat ano 步骤二查询端口号是否被占用 netstat aon findstr 端口号步骤三查询占用端口的应用 tasklist findstr 查询出的 listening 步骤四 taskki
如果有多个异步函数需要保证同时执行并保证全部执行完毕后再进行下一步

array push api post array push api get Promise all array then resArr gt resArr forEach res gt console log res 在 then后面判断
python3 抖音短视频链接去水印下载视频到本地

基于近段时间对抖音快手秒拍等视频抓取一直想搞一下加了个QQ群里面全是自媒体就是抖音快手秒拍的视频搬运工把一个平台搬到另外一个平台上去除水印降低被干掉的危险经过半天的琢磨自己用python也搞出来一个根据抖音分享视频链
python用input输入列表_python怎么用input函数输入一个列表

在Python3 0以后键盘输入使用input函数 gt gt gt x input gt gt gt 123 123 在命令行没有任何显示输入123后直接赋值给x 并打印仅仅使用input是无法解决大部分数据处理的通常输入的字符串
Python构建ANN模型预测气温变化

在利用爬虫模型得到了气温数据集后具体参考上篇Python构建爬虫模型爬取天气数据我们开始利用tensorflow自带的模块搭建一个简单的ANN模型预测气温变化其实这个模型适用于预测很多数据变化趋势这里以预测气温变化为例 import
数据结构--栈—JS实现一个栈结构

数据结构栈 JS实现一个栈结构前言数据结构和算法是脱离语言的比如pop push在js中可以使用但是其他的语言也有吗不一定但是都可以通过数据结构和算法写出其功能 1 栈是一种后进先出 LIFO last in first ou
'utf-8' codec can't decode byte 0xd6 in position 0: invalid continuation byte问题的解决

utf 8 codec can t decode byte 0xd6 in position 0 invalid continuation byte 把 utf 8 改为 gbk
git进行commit撤销，并撤销远程push，回退到之前的版本

刚开始使用版本管理工具选择的是git 各种git终端常用的有SourceTree TortoiseGit git GUI等本人选择的是第一个闲话不多说当你commit并push本地代码到云服务器后发现自己修改的有问题但又不想重
知识图谱学习--网易云唐宇迪老师课程记录

一知识图谱是什么知识图谱是一种图模型可以将各个实体的信息联系在一起形成一个整体知识图谱会应用各种不同技术不仅限于NLP 还包括图像推荐系统等构建一整个关系网络知识图谱在医疗领域的作用二知识图谱的数据怎么处理 1 数据怎
GPT「高仿」问世：GPT-Neo，最大可达GPT-3大小，已开源

GPT 高仿问世 GPT Neo 最大可达GPT 3大小已开源近日有个名叫 EleutherAI的团队创始成员为 Connor Leahy Leo Gao和Sid Black 宣布推出GPT Neo开源项目可用于复现GPT系列的
强化学习-论文调研-experience replay

experience replay 论文调研一论文概要 1 Hindsight Experience Replay 2017 NeurIPS 在奖励稀疏的情况下要用强化学习算法训练是很困难的本文提出一种通过增设不同的目标增加状态转
Amazon Linux 2上面安装Amazon Corretto 8（JDK）

shell 启用Amazon Linux 2 中的aws yum扩展库 sudo amazon linux extras enable corretto8 安装jre sudo yum install java 1 8 0 amazon c
spring cloud jackson自定义文本转换器

由于 spring jackson default property inclusion 配置失效所以得自定义文本转换器废话不多说上代码 Configuration EnableWebMvc public class WebAppCon
pytorch中torchvision.utils包下的save_image函数

雷郭出品函数的用途将NCHW的tensor以网格图的形式存储到硬盘中该图也叫做雪碧图sprite image 如下图所示将多张图以网格的形式拼凑起来每张图的大小是28 28 单通道那宽高如何确定我们可以来看看该函数的源码 de

pytorch中torchvision.utils包下的save_image函数

雷郭出品

pytorch中torchvision.utils包下的save_image函数 的相关文章

随机推荐

热门标签

pytorch中torchvision.utils包下的save_image函数的相关文章