Kaggle猫狗分类Pytorch CNN

2023-11-18

介绍

猫狗分类来源于Kaggle上的一个入门竞赛。

https://www.kaggle.com/competitions/dogs-vs-cats-redux-kernels-edition/overview

代码及解释

首先，导入一系列的库。

import numpy as np
from PIL import Image
from pathlib import Path
import torch
from torch import nn
import torch.nn.functional as F
from torch.utils.data import Dataset, DataLoader, random_split
from torchvision import transforms
import matplotlib.pyplot as plt

这段代码主要是导入了一些Python库，包括：

numpy：Python中常用的科学计算库，用于处理数组、矩阵等数值数据。
PIL（Python Imaging Library）：Python图像处理库，用于处理各种图像格式。
pathlib：Python处理文件和目录路径的标准库，支持多平台。
torch：PyTorch深度学习框架的核心库。
nn：PyTorch中用于构建神经网络的模块。
F（functional）：PyTorch中用于创建自定义卷积层、激活函数等的函数。
DataLoader：PyTorch中用于加载和批量处理数据的工具。
transforms：PyTorch中对图像和数据进行预处理的工具。
matplotlib：Python绘图库，用于绘制数据和图像。

这些库的导入是PyTorch实践项目中经常用到的基础操作，其中PIL、numpy和matplotlib主要用于读取和展示图像、transforms用于对图像进行数据增强，torch和nn则是构建和训练深度神经网络的核心。
而后，启用GPU加速。

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
print("device: ", device)

get_label = lambda x: x.name.split('.')[0]

class get_dataset(Dataset):
    def __init__(self, root, transform=None):
        self.images = list(Path(root).glob('*.jpg'))
        self.transform = transform
    def __len__(self):
        return len(self.images)
    def __getitem__(self, idx):
        img = self.images[idx]
        label = get_label(img)
        label = 1 if label == 'dog' else 0
        if self.transform:
            img = self.transform(Image.open(img))
        return img, torch.tensor(label, dtype=torch.int64)

这段代码定义了一个类get_dataset，用于加载和预处理数据集。
在类的初始化函数中，root为数据集路径，transform为数据预处理函数。通过list和glob函数获取符合条件的文件名，即所有后缀为jpg的图片文件名，并将其转为列表self.images。同时记录transform函数，即数据预处理函数。
__len__函数返回数据集中的图片数量，__getitem__函数根据索引idx获取对应图片和标签。首先获取索引对应的图片img，并通过get_label函数获取该图片对应的标签。该函数将图片文件名以’.‘分割，并将第一个分割出来的字符串作为标签。如果标签等于’dog’，则将其转为数字1，否则转为数字0。
接着如果有定义transform函数，就将img通过transform函数进行数据预处理。最后返回处理后的图片和标签，其中标签用torch.tensor转为整型。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Kaggle猫狗分类Pytorch CNN 的相关文章

尝试理解 Pytorch 的 LSTM 实现

我有一个包含 1000 个示例的数据集其中每个示例都有5特征 a b c d e 我想喂7LSTM 的示例以便它预测第 8 天的特征 a 阅读 nn LSTM 的 Pytorchs 文档我得出以下结论 input size 5 hid
在非单一维度 1 处，张量 a (2) 的大小必须与张量 b (39) 的大小匹配

这是我第一次从事文本分类工作我正在使用 CamemBert 进行二进制文本分类使用 fast bert 库该库主要受到 fastai 的启发当我运行下面的代码时 from fast bert data cls import Bert
从打包序列中获取每个序列的最后一项

我试图通过 GRU 放置打包和填充的序列并检索每个序列最后一项的输出当然我的意思不是 1项目但实际上是最后一个未填充的项目我们预先知道序列的长度因此应该很容易为每个序列提取length 1 item 我尝试了以下方法 impor
使 CUDA 内存不足

我正在尝试训练网络但我明白了我将批量大小设置为 300 并收到此错误但即使我将其减少到 100 我仍然收到此错误更令人沮丧的是在 1200 个图像上运行 10 epoch 大约需要 40 分钟有什么建议吗错了我怎样才能加快这
为什么 pytorch matmul 在 cpu 和 gpu 上执行时得到不同的结果？

我试图找出 numpy pytorch gpu cpu float16 float32 数字之间的舍入差异而我发现的内容让我感到困惑基本版本是 a torch rand 3 4 dtype torch float32 b torch r
如何计算 CNN 第一个线性层的维度

目前我正在使用 CNN 其中附加了一个完全连接的层并且我正在使用尺寸为 32x32 的 3 通道图像我想知道是否有一个一致的公式可以用来计算第一个线性层的输入尺寸和最后一个卷积最大池层的输入我希望能够计算第一个线性层的尺寸仅给出
如何使用pytorch构建多任务DNN，例如超过100个任务？

下面是使用 pytorch 为两个回归任务构建 DNN 的示例代码这forward函数返回两个输出 x1 x2 用于大量回归分类任务的网络怎么样例如 100 或 1000 个输出对所有输出例如 x1 x2 x100 进行硬编码绝对
Pytorch GPU 使用率低

我正在尝试 pytorch 的例子https pytorch org tutorials beginner blitz cifar10 tutorial html https pytorch org tutorials beginner b
pytorch 的 IDE 自动完成

我正在使用 Visual Studio 代码最近尝试了风筝这两者似乎都没有 pytorch 的自动完成功能这些工具可以吗如果没有有人可以推荐一个可以的编辑器吗谢谢你使用Pycharmhttps www jetbrains co
如何从已安装的云端硬盘文件夹中永久删除？

我编写了一个脚本在每次迭代后将我的模型和训练示例上传到 Google Drive 以防发生崩溃或任何阻止笔记本运行的情况如下所示 drive path drive My Drive Colab Notebooks models if p
预期设备类型为 cuda 的对象，但在 Pytorch 中获得了设备类型 cpu

我有以下计算损失函数的代码 class MSE loss nn Module metric L1 L2 norms or cosine similarity mode training or evaluation mode def init
如何计算cifar10数据的平均值和标准差

Pytorch 使用以下值作为 cifar10 数据的平均值和标准差变换 Normalize 0 5 0 5 0 5 0 5 0 5 0 5 我需要理解计算背后的概念因为这些数据是 3 通道图像我不明白什么是相加的什么是除什么的等等
Google Colab 使用 Transformers 和 PyTorch 微调 BERT Base Case 时出现间歇性“RuntimeError: CUDA out of memory”错误

我正在运行以下代码来微调 Google Colab 中的 BERT Base Cased 模型有时代码第一次运行良好没有错误其他时候相同的代码使用相同的数据会导致 CUDA 内存不足错误以前重新启动运行时或退出笔记本返回笔
PyTorch DataLoader 对并行运行的批次使用相同的随机种子

有一个bug https tanelp github io posts a bug that plagues thousands of open source ml projects 在 PyTorch Numpy 中当并行加载批次时Da
运行时错误：大小不匹配，m1：[4 x 3136]，m2：[64 x 5]位于c：\ a \ w \ 1 \ s \ tmp_conda_3.7_1

我使用 python 3 当我插入变换随机裁剪大小 224 时它会给出未匹配错误这是我的代码 https github com kajasumanie medical plant classification blob master i
没有名为“torch”或“torch.C”的模块

希望得到像我 5 这样的解释因为我已经检查了所有相关答案但没有一个有帮助我已经安装了Python 我已经安装了Pycharm 我已经安装了Anaconda 我已经安装了 Microsoft Visual Studio 我有not安装了
如何让火车装载机使用特定数量的图像？

假设我正在使用以下调用 trainset torchvision datasets ImageFolder root imgs transform transform trainloader torch utils data DataLoa
PyTorch 中的数据增强

我对 PyTorch 中执行的数据增强有点困惑现在据我所知当我们执行数据增强时我们保留原始数据集然后添加它的其他版本翻转裁剪等但 PyTorch 中似乎并没有发生这种情况据我从参考文献中了解到当我们使用data tra
PyTorch 中的标签平滑

我正在建造一个ResNet 18分类模型为斯坦福汽车使用迁移学习的数据集我想实施标签平滑 https arxiv org pdf 1701 06548 pdf惩罚过度自信的预测并提高泛化能力 TensorFlow有一个简单的关键字参数Cr
设置 torch.gather(...) 调用的结果

我有一个形状为 n x m 的 2D pytorch 张量我想使用索引列表来索引第二个维度可以使用 torch gather 完成然后然后还设置新值到索引的结果 Example data torch tensor 0 1 2 3 4

随机推荐

使用Python构建强大的网络爬虫

介绍网络爬虫是从网站收集数据的强大技术而Python是这项任务中最流行的语言之一然而构建一个强大的网络爬虫不仅仅涉及到获取网页并解析其HTML 在本文中我们将为您介绍创建一个网络爬虫的过程这个爬虫不仅可以获取和保存网页内容还可
【满分】【华为OD机试真题2023 JAVA&JS】字符串重新排序

华为OD机试真题 2023年度机试题库全覆盖刷题指南点这里字符串重新排序知识点排序数组时间限制 1s 空间限制 256MB 限定语言不限题目描述给定一个字符串s s包含以空格分隔的若干个单词请对s进行如下处理后输出 1 单词
ctfshow web171-174

Web 171 打开发现以下内容看到了一个查询语句于是认真看了一下拼接sql语句查找指定ID用户 sql select username password from user where username flag and id GE
shell脚本中$#、$*、$@、$?、$0-n等含义一次性搞明白！！！

一 Shell脚本变量的含义 1 表示执行脚本传入参数的个数 2 表示执行脚本传入参数的列表不包括 0 3 表示进程的id Shell本身的PID ProcessID 即脚本运行的当前进程ID号 4 Shell最后运行的后台Proces
了解少儿编程和机器人编程的区别

最近少儿编程已经成了炽手可热的培训不过很多家长也在网上看到有很多网站也提到了机器人编程这就让很多家长纳闷了都是编程少儿编程和机器人编程有什么区别呢现在我们就一起和南京小码王少儿编程培训机构来看下吧一少儿编程和机器人编程是什么机
看天气WeatherCan V1.0 ---气象数据分析系统web版

版权声明本文为CSDN博主老郭1 的原创文章遵循CC 4 0 BY SA版权协议转载请附上原文出处链接及本声明原文链接 https blog csdn net HZGJF article details 104772394 Wea
电脑睡眠，休眠，关闭硬盘的区别

最近在设置电源选项是对电脑睡眠休眠关闭硬盘不太了解就上网查了一下睡眠是一种节能状态睡眠可保存所有打开的文档和程序当您希望再次开始工作时可使计算机快速恢复全功率工作通常在几秒钟之内使计算机进入睡眠状态就像是暂停DVD 播放器
支付宝转账有“后悔药”了遇诈骗这样做可冻结资金

在支付宝上转完账猛然意识到可能是骗子怎么办今后可以一键撤回了昨天在2018网络安全生态峰会上蚂蚁金服集团副总裁芮雄文宣布支付宝的延时到账升级为2 0 如果遭遇诈骗只要延时转账还未到账及时报警就能冻结交易一旦警方下达止付
C++ primer Plus 第十三章复习题

1 派生类从基类哪里继承了什么成员数据还有一半的成员函数公有成员和保护成员是可见得私有成员不可见 2 派生类不能从基类哪里继承什么构造函数析构函数赋值运算符还有友元函数都不能继承 3 假设baseDMA operator
大数据毕业设计深度学习股票预测系统 - python lstm

文章目录 0 前言 1 课题意义 1 1 股票预测主流方法 2 什么是LSTM 2 1 循环神经网络 2 1 LSTM诞生 2 如何用LSTM做股票预测 2 1 算法构建流程 2 2 部分代码 3 实现效果 3 1 数据 3 2 预测结果
什么是高内聚，低耦合？

高内聚低耦合是一个老生常谈的话题所以拿出来说一下我们在看Linux的一些资料或者是在面试又或者跟一个比较牛的大佬讨论技术的时候可能会听到这个概念所以什么是高内聚低耦合呢高内聚我们指的是认识的一群人或者一些东西分成的一类
第一次从零到有开发项目

在达内培训中我们有项目峰会的活动身为项目组长我组织了我的组员们从零到有进行了一个类CSDN的博客网站开发目录项目介绍项目页面总结项目介绍 Kun吧 Kun吧是一个类csdn的学习技术社区在这里可以交流学习技术分享学习日常
第十一届蓝桥杯C/C++回文日期

include
程序员转行做什么工作比较好？

作为程序员来说其实程序员的发展之路有多种你可以结合自己的实际情况去做出相应的选择程序员最基本的发展路线就是从普通程序员做到熟练的开发者接下来就会有多种选择你可以选择做高级开发工程师也可以成为一个一线熟练的开发人员或者你也可以
Yolo v7的最简TensorFlow实现

Yolo v7去年推出之后取得了很好的性能作者也公布了基于Pytorch实现的源代码在我之前的几篇博客当中对代码进行了深入的解析了解了Yolo v7的技术细节和实现机制因为我一直是用的Tensorflow 因此也想尝试把代码移植
c#数据结构转c++指针

C string转c char C 使用IntPtr类型接受Marshal StringToHGlobalAnsi分配的内存 string sno 12345 IntPtr strsno Marshal StringToHGlobalAns
c++基础：循环练习案例展示

1 猜数字题目系统随机生成一个1到100的数字玩家进行猜测如果猜错提示玩家数字过大或过小如果猜对恭喜玩家胜利并且退出游戏代码 include
Portainer -- Docker可视化管理工具

http blog csdn net A632189007 article details 78779920 https portainer io install html https portainer readthedocs io en
vue3 computed

前言 import computed from vue let aa computed gt 传回调函数 let aa computed 传对象返回的类似一个ref包装的响应式对象如果值是基本数据类型需要 value进行拆箱一常规
Kaggle猫狗分类Pytorch CNN

介绍猫狗分类来源于Kaggle上的一个入门竞赛 https www kaggle com competitions dogs vs cats redux kernels edition overview 代码及解释首先导入一系列的库

Kaggle猫狗分类Pytorch CNN

介绍

代码及解释

Kaggle猫狗分类Pytorch CNN 的相关文章

随机推荐

热门标签