深度学习框架Pytorch——学习笔记(九) 基础知识补充

2023-05-16

由于基础知识不牢固,又学习了一下其他入门学习资料。
pytorch中文手册   
https://github.com/zergtant/pytorch-handbook 

入门基础补充

相比之前学过的东西,一些常用的东西做了下补充。

任何以“_” 结尾的操作,其结果都会替换原变量。
torch.view与numpy的reshape类似。 x.view(-1, 8) 等。
如果Tensor中只有一个元素,使用 .item()得到python数据类型的数值。

cpu转GPU类型

.to()方法 或者 .cuda() 方法
device = torch.device("cuda") 选择设备
x = x.to(device)

如果Tensor中属性 .requires_grad为True,将跟踪该张量的操作。
为防止跟踪(不求梯度),可以包装在 with torch.no_grad()

"torch.nn"只支持小批量输入。 [s Sample, nChannls, hHeight, wWidth]

数据一般情况是先转为numpy,后转为Tensor。
python常用数据工具

图像使用  pillow, opencv
音频使用  scipy, librosa
文本可以使用 os和Cython来加载,或者使用NLTK或Spacy处理 

多GPU训练
使用nn.DataParalle 来包装模型
if torch.cuda.device_count()>1:
model = nn.DataParalle(model)
model.to(device)
会自动分配数据

欠拟合

修改网络结构,如增加隐藏层数目
训练更长的时间
寻找合适的网络结构,使用更大的nn网络

过拟合
使用更多的数据,数据融合
正则化
寻找合适的网络,dropout

卷积神经网络 (分类,回归)

组成

卷积层 一个核代表一个特征 下一层特征宽度计算 ns=(n-f+2p)/s +1
激活函数 非线性变换,过滤无用信息
池化层 减低复杂度 下一层特征宽度计算 ns=(n-f)/2+1
dropout 防止过拟合的一种方法
全连接层 作为输出层使用(有时也用1 * 1 的卷积进行输出),需要将输入过来的数据压扁,变成一维的向量。如果进行分类,就使用softmax作为输出。如果是回归,直接使用linear输出。

循环神经网络 (翻译,语音,生成描述)

在这里插入图片描述
相当于同一个神经网络的多次赋值。
将网络的输出保存在一个记忆单元中,这个记忆单元和下一次的输入一起进入神经网络中。我们可以看到网络在输入的时候会联合记忆单元一起作为输入,网络不仅输出结果,还会将结果保存到记忆单元中。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

深度学习框架Pytorch——学习笔记(九) 基础知识补充 的相关文章

  • CentOS中使用kolla-ansible快速部署OpenStack All-In-One

    准备 系统 xff1a CentOS 7两块网卡 xff1a eth0 xff1a 172 16 140 15 管理网eth1 xff1a 192 168 1 16 业务网 存储网 CPU xff1a 8C内存 xff1a 16G系统盘 x
  • linux安装部署mysql服务 tar.gz rpm两种安装方式教程

    一 介绍 本教程为linux下安装部署mysql服务 xff0c 安装方式分为两种 xff0c 一种tar gz包安装 xff0c 另一种为rpm包安装 二 准备工作 服务器 xff1a linxu CentOS 7 mysql服务tar
  • C:_debug_printf,基于vsnprintf 或 vprintf实现带时间戳和源码信息(__FILE__,__FUNCTION__, __LINE__)的格式化打印输出

    写C程序的时候 printf输出调试信息是常态 xff0c printf输出调试信息时如果能自动带源码信息 FILE FUNCTION LINE xff0c 显然更方便查找问题 xff0c 如果能再加上时间戳就更完美了 如果到处都用prin
  • axios.create的理解以及在VUE项目中为何要对axios进行封装

    最开始学习的时候 xff0c 一直不太理解axios中create的用法 xff0c 今天来大概聊聊 进入公司后 xff0c 发现公司并不是用的axios去获取接口 xff0c 而是对axios进行了一次封装 xff0c 因为我们的项目比较
  • MySQL查看和修改字符集

    一 查看字符集 查看MYSQL数据库服务器和数据库字符集 方法一 xff1a show variables like 39 character 39 方法二 xff1a show variables like 39 collation 39
  • 安装arm_qt交叉编译环境(亲测有效)

    1 下载编译器Linaro Releases Linaro Releases 这里面的版本特别多 xff0c 对应的版本都会不一样 xff0c 如下图 需要看arm开发板是32位的还是64位的 xff0c 我用的开发板是32位的 xff0c
  • linux服务器之间数据迁移权限不够解决方案

    问题描述 xff1a linux下服务器之间迁移文件 xff0c 因权限不够 xff0c 无法迁移成功 Permission denied 原因分析 xff1a 用户权限不够 xff0c 无法迁移到指定目录 解决方案 xff1a 首先在目标
  • rust 条件语句和循环的用法 -7

    目录 一 xff0c 条件语句 二 xff0c 循环 xff08 一 xff09 loop xff0c while for 三种循环 xff0c 三个返回关键字 continue break return xff08 二 xff09 for
  • 避坑-go语言S3参数详解

    云端 事实上 xff0c 笔者之前对互联网存储方式基本没有概念 xff0c 在6个月前才开始接触nas存储 对象存储等 xff0c 并且直接参与项目 xff0c 当时可谓一头雾水 xff0c 连续两晚工作到凌晨才算完成当时s3对象存储求 x
  • 排序——冒泡排序法

    随着大数据和人工智能技术的普及和应用 xff0c 企业所拥有的数据量堵在成倍的增长 xff0c 排序算法成为不可或缺的重要工具之一 排序的过程中 xff0c 数据的移动方式可以分为 直接移动 和 逻辑移动 两种 直接移动 是交换存储数据的位
  • 排序——插入排序法

    插入排序法 插入排序法是将数组中的元素注意与以为排序好的数据进行比较 xff0c 先将前两个元素先派好 xff0c 再将第三个元素插入到适当的位置 也就是这三个元素仍然是排序好的 xff0c 接着将第四个元素加入 xff0c 重复此步骤 x
  • 笔记本电脑键盘失灵拯救方法总结

    笔记本键盘失灵怎么办 笔记本键盘失灵原因屏幕键盘的使用笔记本键盘拯救方案一笔记本键盘拯救方案二 笔记本键盘失灵原因 驱动失效 xff0c 相关文件被删除 xff1b 硬件损坏这种情况很少 xff0c 本文不做硬件修理讨论 xff1b 注册表
  • CATIA二次开发CAA安装

    安装资料在网盘里 Win7 64位 以下软件均已管理员身份运行 xff1a 1 安装vs2008 gt 自定义安装 gt 选择要安装的功能 gt Visual C 43 gt x64编译器和工具 1 2安装SP1 2 安装CATIA V5
  • 在3080显卡电脑上安装Linux系统

    首先电脑配置如下 xff1a 品牌 xff1a 微星 GP76 笔记本电脑 BIOS xff1a American Megatrends International LLC E17K4IMS 404 2022 1 21 CPU xff1a
  • Linux:文件系统

    Linux文件系统简介 1 Linux文件系统与Windows有较大的差别 Windows的文件结构是多个并列的树状结构 xff0c 最顶部的是不同的磁盘 分区 xff0c 如C D E F等 Linux的文件结构是单个的树状结构 xff0
  • Linux:服务器相关指令

    服务相关命令 1 随着微服务兴起 xff0c springboot也用得越来越多 xff0c springboot项目默认是打包成jar包的 xff0c 执行jar包就可以同时启动其内置的tomcat xff0c 免去了单独部署tomcat
  • Linux:用户相关

    Linux用户 1 Linux系统是一个多用户多任务的分时操作系统 xff0c 任何一个要使用系统资源的用户 xff0c 都必须首先向系统管理员申请一个账号 xff0c 然后以这个账号的身份进入系统 2 用户的账号一方面可以帮助系统管理员对
  • Selenium:简介

    HTML简介 1 HTML中文为超文本标记语言 HyperText Markup Language 是一种用于创建网页的标准标记语言 2 HTML是用来描述网页的一种语言 nbsp nbsp nbsp HTML不是一种编程语言 而是一种标记
  • Selenium:元素定位

    Selenium自动化测试 1 Selenium对网页的控制是基于各种前端元素的 在使用过程中 对于元素的定位是基础 只有准确抓取到对应元素才能进行后续的自动化控制 nbsp nbsp nbsp 前面介绍了前端网页HTML是由很多标签元素有
  • Selenium:浏览器操作

    Selenium浏览器操作 1 前面介绍过 根据Selenium下的WebDriver类可以实例化一个浏览器WebDriver对象 返回WebDriver对象 2 打开一个指定网页 定位HTML文档中指定元素都是根据浏览器WebDriver

随机推荐

  • Selenium:弹窗处理

    HTML中的弹窗 1 在实际系统中 在完成某些操作时会弹出对话框来提示 主要分为 警告消息框 确认消息框 提示消息对话 三种类型的对话框 2 警告消息框 alert 警告消息框提供了一个 确定 按钮让用户关闭该消息框 并且该消息框是模式对话
  • Selenium:表单切换

    表单 1 就是网页标签名为frame或iframe的元素 表单引用了其他页面的链接 真正的页面数据没有出现在源码中 但是在浏览器中可以看见 与浏览器的多个窗口类似 nbsp nbsp nbsp 这里说的表单不是HTML中的form标签 而是
  • Seleniu:元素常用操作

    Selenium元素操作 1 在使用Selenium过程中 仅仅是对元素进行定位和对浏览器WebDriver对象进行操作是完全不够的 更多的是需要我们对一个元素进行操作 nbsp nbsp nbsp 比如 向输入框中输入数据 点击按钮等等
  • Selenium:鼠标、键盘事件

    鼠标事件 1 前面介绍了Selenium中模拟鼠标 左键单击 的方法click 仅仅只有这个方法是完全不够的 现在的Web产品中提供了更丰富的鼠标交互方式 nbsp nbsp nbsp 例如鼠标右击 双击 悬停 拖动等功能 nbsp nbs
  • rust实现一个tcp server

    服务端 use std net TcpListener TcpStream use std thread use std time use std io use std io Read Write fn handle client mut
  • Selenium:元素判断

    判断元素是否存在 1 前面有介绍过使用Python中的sleep 方法来进行等待 等待一定的时间 让元素加载出来后再执行代码 nbsp nbsp nbsp 但是元素加载出来的时间是不固定的 有时长有时短 因此我们等待的时间就不固定了 nbs
  • Selenium:元素等待

    元素等待 1 前面介绍过 在使用Selenium做Web自动化过程中 可能会因为网络等原因导致页面元素没有加载出来就执行了代码 进而导致报错 nbsp nbsp nbsp 特别是在进行元素定位时 经常会遇到元素未加载出来就执行了定位代码 导
  • Selenium:操作Cookie

    什么是Cookie 1 Cookie用于辨别用户身份 访问服务器时保持登录状态等功能 用于服务器识别当前访问的是哪个用户 2 在网站中 http请求是无状态的 无状态是指协议对于事务处理没有记忆能力 每次请求都是完全独立 互不影响的 没有任
  • Selenium:操作JS

    JavaScript 1 JavaScript是Web的编程语言 所有现代的HTML页面都会使用JavaScript nbsp nbsp nbsp JavaScript是运行在客户端 浏览器 和服务器端的脚本语言 允许将静态网页转换为交互式
  • Selenium:下拉框操作

    下拉框 1 在Web网页中经常会遇到下拉框 下拉列表 比如说分页 每页显示的条数 语言的切换等功能 很多时候经常都是以下拉框的形式展现 2 下拉列表是网页中一种最节省页面空间的选择方式 默认状态下只显示一个选项 只有单击下拉按钮后才能看到全
  • Selenium:上传、下载文件

    Selenium 上传 下载文件 1 上传文件是比较常见的Web功能之一 比如 常见的上传头像功能 2 对于Web页面的上传功能实现一般有以下两种方式 nbsp nbsp nbsp 普通上传 普通的附件上传是将本地文件的路径作为作为一个值放
  • Python:类的__dict__属性

    Python中类的 dict 属性 1 Python中一切皆对象 nbsp nbsp nbsp 不管是内置的数据类型 内置函数 内置类 第三方类 还是自定义类都叫做对象 nbsp nbsp nbsp 一个对象就会有自己的方法或属性 只是说有
  • Python:处理XML文件汇总

    处理XML文件汇总 1 前面介绍了使用Python中的ElementTree库来解析 创建XML文件 nbsp nbsp nbsp 如果对这个库不了解的可以先去看看这个库 nbsp nbsp nbsp 地址 https mouse blog
  • Python:json数据与Python对象之间的转换

    json数据与Python对象之间的转换 1 前面介绍了在Python中如何处理json数据 主要使用了以下几个方法 nbsp nbsp nbsp dumps 将Python对象转换为JSON格式的字符串 nbsp nbsp nbsp du
  • 用结构体指针访问结构体中的结构体指针(结构体指针的嵌套)

    结构体中的结构体指针是使用 一 问题背景二 代码三 说明 一 问题背景 日常工作中没有编程的机会 xff0c 所以只看得懂代码 xff0c 现在需要重新写一段代码 xff0c 实现固定格式存储数据 xff0c 需要使用到结构体和结构体指针
  • MOOC —— Python语言基础与应用 by 北京大学 第五章 计算和控制流(一)

    第五章 计算和控制流 xff08 一 xff09 23 自动计算过程24 控制流程25 条件分支语句26 条件循环27 迭代循环28 上机练习 基本的计算程序测验题 23 自动计算过程 简单介绍了 冯 诺依曼结构计算机 xff0c 五大部件
  • 关于sort函数中的cmp参数的笔记(C++)

    C 43 43 中sort函数是经常会用到的一个函数 xff0c 主要的功能是排序 xff0c 可以给数组 xff0c 或者链表list 向量排序 sort first pointer first pointer 43 n cmp 在三个参
  • 16进制转10进制方法(初级)

    目标 xff1a 输入16进制字符串 xff0c 输出对应10进制数字 以下以一个题目给出方法 xff1b span class token comment span span class token comment coding in 2
  • 图像格式RGB与BGR互转

    在opencv中 xff0c 读取后图像的格式为BGR的 与其它的读取图像方式不同 xff0c 需要进行转换 基于python的切片特性 xff0c 可以快速进行转换 BGR to RGB opencv 转 常规img im 61 im 1
  • 深度学习框架Pytorch——学习笔记(九) 基础知识补充

    由于基础知识不牢固 xff0c 又学习了一下其他入门学习资料 pytorch中文手册 https github com zergtant pytorch handbook 入门基础补充 相比之前学过的东西 xff0c 一些常用的东西做了下补