pytorch自学笔记（旧）

2023-11-12

pytorch自学笔记

数据预处理

数据预处理

心得笔记

        首先要理解一下pytorch中的神经网络的数据格式，通过print打印mnist数据的shape可以知道，输入pytorch中nn.model中的数据的shape格式如下：
                                        [[batch_size, 1, 28, 28]]
        其中，batch_size就是每次该网络同时处理的图片数，设置合理的baich_size可以加快训练的运行速度与模型的稳定性（亲测如此）。然后‘1’就是通道数，因为我打印的时mnist数据集的shape，它是灰度图片，所以通道数为1，如果图片为彩色图片，其通道数为3。最后两个‘28’就是图片的像素大小了，可以通过该图片文件的属性中的详细属性看到。

代码分析

需要用到的包

import torch
from torchvision import datasets, tranforms
from torch.utils.data import DataLoader

如何预处理自己的图片文件

网上有很多关于mnist数据集的预处理方法，但当我们自己要处理自己的图片文件时，就显得有些不知所措，详细请看代码：

import torch
import torchvision
import torch.nn as nn
import torch.optim as optim
'''
 定义一个转化函数，目的就是可以把我们常见的图片文件（jpg，png等)通过torchvision.transforms.ToTensor()函数
 转化成tensor格式，然后再通过torchvision.transforms.Normalize([0.5,0.5,0.5],[0.5,0.5,0.5])
 函数进行图片归一化，即将tensor中的值都限定在-1到1之间。
'''
transfroms = torchvision.transforms.Compose([torchvision.transforms.ToTensor()],
									torchvision.transforms.Normalize([0.5,0.5,0.5],[0.5,0.5,0.5]))
'''
 读取目录下的图片文件，你的文件夹格式应该为如下情况：
	 directory/
	├── class_x
	│   ├── xxx.jpg
	│   ├── xxy.jpg
	│   └── ...
	│       └── xxz.jpg
	└── class_y
	    ├── 123.jpg
	    ├── nsdf3.jpg
	    └── ...
	    └── asd932_.jpg
 即，directory下面有各种各样的类别文件夹，然后在这个类别文件夹下才是你自己的图片文件，之所以需要这样
 是因为，它这个torchvision.datasets.DatasetFolder函数能够根据你的class_x的名字来自动定义标签，
 如上，class_x文件夹下的图片的标签就是0，class_y下的图片标签就是1，以此类推。
'''							
imagenet_data = torchvision.datasets.DatasetFolder('path/to/directory/'， transform=transfroms )
'''
最后就是构造一个迭代器了，batch_size就是接下来要批量处理的数量，shffle标志是否给imagenet_data中的数据打乱，顺序随机一下。
'''
data_loader = torch.utils.data.DataLoader(imagenet_data,
                                          batch_size=4,
                                          shuffle=True)
'''
 最后就是可以处理数据了，我们先假设我们已经构造好了模型为model, 损失函数为criterion，优化函数为optimizer
'''
model = ’自己的网络结构‘
optimizer = optim.Adam(model.parameters(), lr=0.0001) # 优化方法，学习率为lr的值
criterion = nn.MSELoss() # 损失函数，即计算模型的预测值和真实标签label的差异大小的函数
epoch = 200 # 将整个数据集训练200次
for i in range(epoch):
	for data in data_loader:
		imgs, labels = data  #提出图片和该图片的标签
		# ======前向传播=======
		outputs = model(img)   
		loss = criterion(outputs, labels)
		# ======反向传播=======
		optimizer.zero_grad()
		loss.backward()
		optimizer.step()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

学习

Pytorch

pytorch自学笔记（旧）的相关文章

Model() 获得参数“nr_class”的多个值 - SpaCy 多分类模型（BERT 集成）

您好我正在致力于使用新的 SpaCy 模型实现多分类模型 5 类 en pytt bertbaseuncased lg 新管道的代码在这里 nlp spacy load en pytt bertbaseuncased lg textcat
为什么 RNN 需要两个偏置向量？

In Pytorch RNN 实现 http pytorch org docs master nn html highlight rnn torch nn RNN 有两个偏差 b ih and b hh 为什么是这样它与使用一种偏差有什么
一次热编码期间出现 RunTimeError

我有一个数据集其中类值以 1 步从 2 到 2 i e 2 1 0 1 2 其中 9 标识未标记的数据使用一种热编码 self one hot encode labels 我收到以下错误 RuntimeError index 1 is
如何更新 PyTorch 中神经网络的参数？

假设我想将神经网络的所有参数相乘PyTorch 继承自的类的实例torch nn Module http pytorch org docs master nn html torch nn Module by 0 9 我该怎么做呢 Let n
如何使用Python计算多类分割任务的dice系数？

我想知道如何计算多类分割的骰子系数这是计算二元分割任务的骰子系数的脚本如何循环每个类并计算每个类的骰子先感谢您 import numpy def dice coeff im1 im2 empty score 1 0 im1 numpy
如何从已安装的云端硬盘文件夹中永久删除？

我编写了一个脚本在每次迭代后将我的模型和训练示例上传到 Google Drive 以防发生崩溃或任何阻止笔记本运行的情况如下所示 drive path drive My Drive Colab Notebooks models if p
如何计算cifar10数据的平均值和标准差

Pytorch 使用以下值作为 cifar10 数据的平均值和标准差变换 Normalize 0 5 0 5 0 5 0 5 0 5 0 5 我需要理解计算背后的概念因为这些数据是 3 通道图像我不明白什么是相加的什么是除什么的等等
使用 PyTorch 分布式 NCCL 连接失败

我正在尝试使用 torch distributed 将 PyTorch 张量从一台机器发送到另一台机器 dist init process group 函数正常工作但是 dist broadcast 函数中出现连接失败这是我在节点 0
Pytorch RuntimeError：“host_softmax”未针对“torch.cuda.LongTensor”实现

我正在使用 pytorch 来训练模型但是在计算交叉熵损失时我遇到了运行时错误 Traceback most recent call last File deparser py line 402 in
Pytorch .to('cuda') 或 .cuda() 不起作用并且卡住了

我正在尝试做 pytorch 教程当我尝试将他们的设备设置为 cuda 时它不起作用并且我的代码运行被卡住有关具体信息我正在使用 conda 环境蟒蛇3 7 3 火炬1 3 0 cuda 10 2 NVIDIA RTX2080TI
如何同时有效地运行多个 Pytorch 进程/模型？ Traceback：分页文件太小，无法完成此操作

背景我有一个非常小的网络我想用不同的随机种子进行测试该网络几乎只使用了我的 GPU 计算能力的 1 因此理论上我可以同时运行 50 个进程来同时尝试许多不同的种子 Problem 不幸的是我什至无法在多个进程中导入 pytorch 当
尝试将 cuda 与 pytorch 一起使用时出现运行时错误 999

我为我的 Geforce 2080 ti 安装了 Cuda 10 1 和最新的 Nvidia 驱动程序我尝试运行一个基本脚本来测试 pytorch 是否正常工作但出现以下错误 RuntimeError cuda runtime erro
无法在 Windows 10 上构建 Detectron2

尽管 Windows 上的 Detectron2 没有官方支持但有很多可用的说明我尝试按照这些说明进行操作但最终出现了相同的错误这是我的设置 OS Windows 10 专业版 19043 1466 微软视觉工作室 2019 CUD
如何屏蔽 PyTorch 权重参数中的权重？

我正在尝试在 PyTorch 中屏蔽强制为零特定权重值我试图掩盖的权重是这样定义的def init class LSTM MASK nn Module def init self options inp dim super LSTM
如何以干净高效的方式在 pytorch 中获得小批量？

我试图做一件简单的事情即使用火炬通过随机梯度下降 SGD 训练线性模型 import numpy as np import torch from torch autograd import Variable import pdb def
没有名为“torch”或“torch.C”的模块

希望得到像我 5 这样的解释因为我已经检查了所有相关答案但没有一个有帮助我已经安装了Python 我已经安装了Pycharm 我已经安装了Anaconda 我已经安装了 Microsoft Visual Studio 我有not安装了
PyInstaller 可执行文件无法获取 TorchScript 源代码

我正在尝试使包含 PyTorch 的脚本在 Windows 中可执行我的脚本的导入是 import numpy core multiarray which is a workaround for ImportError numpy cor
PyTorch 中的数据增强

我对 PyTorch 中执行的数据增强有点困惑现在据我所知当我们执行数据增强时我们保留原始数据集然后添加它的其他版本翻转裁剪等但 PyTorch 中似乎并没有发生这种情况据我从参考文献中了解到当我们使用data tra
PyTorch 中的标签平滑

我正在建造一个ResNet 18分类模型为斯坦福汽车使用迁移学习的数据集我想实施标签平滑 https arxiv org pdf 1701 06548 pdf惩罚过度自信的预测并提高泛化能力 TensorFlow有一个简单的关键字参数Cr
PyTorch：运行时错误：函数 MulBackward0 在索引 0 处返回无效梯度 - 预期类型 torch.cuda.FloatTensor 但得到 torch.FloatTensor

我不明白这个错误告诉我什么在另一个帖子 https github com NVIDIA flownet2 pytorch issues 139也解决了同样的问题但没有有效的解决方案 Traceback most recent call

随机推荐

时域采样，频域为什么周期延拓了

频域周期延拓只是表面现象其实质是不同的信号采样后的像可能相同不可区分如果硬要做实验还是要有一定的编程基础起码要整一个声音出来让你听一听可是你要重复这一实验可能又太难了所以我还是讲一讲简单的数学原理并用简单的三角函数及程序验
Linux系统同时安装MySQL5.7和MySQL8.0

本文是在一台Centos7虚拟机上面同时安装mysql5 7和mysql8 0的步骤记录一下方便后续回顾这篇文章之后会接着学习搭建两台虚拟机一主一从的架构其中配置的文件名称目录端口号 IP地址要根据自己电脑的实际情况进行更改 m
Ubuntu 22.04上安装Docker的完整过程

更新系统软件包 sudo apt update 安装所需的依赖包以允许APT使用HTTPS sudo apt install apt transport https ca certificates curl software proper
Docker构建tomcat无法用startup.sh启动，无法输出catalina.out

最近部署测试环境想尝试一下docker 毕竟技术人不能落伍 So 我先学习了一下docker的简单使用很多东西都是实践出真知没必要看书找教程大概看一下能干就可以了菜鸟教程地址Docker 教程菜鸟教程初学者可以了解一下下面进
编程变量命名的一些技巧

最近做项目仿真时在编程的时候发现自己对变量的命名比较混乱没有统一的规则故搜集了一些资料对变量命名的技巧和原则有所了解和总结总的来说就是英文字母大小写数字下划线按照一定的规则搭配自己比较喜欢的是帕斯卡 pascal 命名法和
stm32f103 TIM2定时器4路PWM输出实验

这里以TIM2为例 pwm c include pwm h uint16 t TIM2 CCR1 Val uint16 t TIM2 CCR2 Val uint16 t TIM2 CCR3 Val uint16 t TIM2 CCR4 Va
【前端】HTML基础总结

概要 html基本结构 nbsp 空格 emsp 空字符 html标签 h1 h1 标题标签1 6之间字体大小逐渐减小 p p 段落标签 b b 加粗 strong strong 加粗优化搜索 i i 斜体 div div 块级元素 spa
数据结构学习——栈的应用：迷宫问题

简介基于栈的迷宫问题本质上是深度优先遍历从起点开始深度优先搜索遇到碰壁的情况时根据栈的特性可以回溯到之前走过的路并继续搜索未搜索的方向具体实现我使用的ide是qt 它里面的一些图形库有助于我更加直观地理解深度优先搜索的过
华为OD机试真题-评论转换输出-2023年OD统一考试（B卷）

题目描述在一个博客网站上每篇博客都有评论每一条评论都是一个非空英文字母字符串评论具有树状结构除了根评论外每个评论都有一个父评论当评论保存时使用以下格式首先是评论的内容然后是回复当前评论的数量最后是当前评论的所有子评论
服务器显示中国移动,中国移动服务器地址是什么

中国移动服务器地址是什么内容精选换一换域名的DNS服务器定义了域名用于解析的权威DNS服务器通过华为云注册成功的域名默认使用华为云DNS进行解析详细内容请参见华为云DNS对用户提供域名服务的DNS是什么若您选择非华为云DNS进
微服务部署：蓝绿部署、滚动部署、灰度部署（金丝雀部署）、功能开关发布

简介产品或项目不可能一步到位一次性推向用户故而有版本的存在在app版本更新或者项目迭代的过程中不可避免需要发布发布就是部署部署就是修改修改则意味着风险目前有很多用于部署的技术本文将目前常用的布署方案做一个总结备注本文
C++指针的注意事项

1 定义指针时切勿忘记初始化 2 当指针作为函数参数时函数体内记得判空 3 动态申请内存时不要忘记判断内存申请是否成功 4 勿忘释放内存并且只释放堆内存即动态申请的内存 5 内存释放后记得将指针置空 6 函数返回值一定不要是局部
恶意域名解析

原因今天在使用搜狗搜索我们公司的网站名称的时候搜索到一个域名为 test99 cn的网站打开直接弹出了我们的后台管理系统后果非法网站被工信部扫描到之后将会影响到该主机客户的域名备案等信息另外我们的后台管理系统就这样被暴露了解决
linux内核配置支持ipv6,Linux系统IPv6配置

1 自动获取IPV6地址修改 etc sysconfig network文件加入下列配置文本 NETWORKING IPV6 yes 然后运行命令service network restart 用命令ifconfig a 查看IPV6
远程RPC+插桩巧解瑞数5，人人都能懂的瑞数（附源码）

前言众所周知 rpc对于一些复杂的加密有奇效我们只需要找到加密函数所在的位置即可通过RPC远程调用从而省去了扣代码补环境等掉头发过程本篇以维普期刊为例一探瑞数的奥秘 1 抓包分析请求接口通过抓包分析可知我们要找的url是Sea
学习笔记-Matlab算法篇-差分方程建模

差分方程建模 01差分方程建模 02蛛网模型问题提出在自由竞争的社会中很多领域会出现循环波动的现象在经济领域中可以从自由集市上某种商品的价格变化看到如下现象在某一时期商品的上市量大于需求引起价格下跌生产者觉得该商品无利可图
诗词-- 收集

摘自语录 1 所有的优越感都来自缺乏见识和缺乏悲悯 2 如果一样东西你得到了却觉得不过如此那么这个东西其实是你的欲望如果一样东西你得到了之后依然爱不释手那么这这才是你真正想要的 3 不行动的话你永远都是观众 4 别用自我牺牲
Qt扫盲-QStackedWidget理论总结

QStackedWidget理论总结 1 简述 2 布局用法 3 页面切换 4 常用功能 1 简述 QStackedWidget和QTabWidget的功能类似都是为解决大量的控件在一个页面上可能显示不出来同时呢这些控件也可以按一定方
学习笔记——git从远程仓库拉取代码修改并提交和本地代码提交到远程仓库

最近开始学习使用git 找了好多博主的文章总结了一下并非原创多多指教一 git从远程仓库拉取代码修改并提交 1 本地新建项目目录 2 从远程仓库拉取代码到本地 git clone git xxx xxx git 注默认拉取的是mas
pytorch自学笔记（旧）

pytorch自学笔记数据预处理心得笔记代码分析需要用到的包如何预处理自己的图片文件数据预处理心得笔记首先要理解一下pytorch中的神经网络的数据格式通过print打印mnist数据的shape可以知道输入pytorc