Pytorch模型保存与加载模型继续训练

2023-11-06

1. 网络模型定义与模型参数保存

定义网络模型与基本参数，以及模型训练和模型保存

使用torch.save()方法保存模型

在save_dict={}中可以保存epoch,model,optimizer,scheduler,loss等参数。

my_net = VisionTransformer()
n_epoch = 200
lr = 0.001
optimizer = optim.SGD(my_net.parameters(), lr=lr, momentum=0.9, weight_decay=1e-6)
scheduler = lr_scheduler.CosineAnnealingLR(optimizer=optimizer, T_max=n_epoch, eta_min=lr / 100)
loss_classification = torch.nn.CrossEntropyLoss()

if cuda:
    my_net = my_net.cuda()
    loss_classification = loss_classification.cuda()

for p in my_net.parameters():
    p.requires_grad = True
bestacc = 0.0
savepth = 'mySavepthPath'
for epoch in range(n_epoch):
    my_net.train()
    ....
    if acc > bestacc:
        save_dict = {
            'epoch': epoch,
            'model': my_net.state_dict(),
            'optimizer': optimizer.state_dict()
        }
        torch.save(save_dict, savepth + '.pth')

2. 加载模型继续训练

使用torch.load加载模型，完整代码如下。

要注意的是，要先定义模型和优化器optimizer，把模型放到gpu上，然后再加载模型。
否则执行optimizer.step()时会出现下面这个错误。

Expected all tensors to be on the same device, but found at least two devices, cuda:0 and cpu!

my_net = VisionTransformer()
n_epoch = 200
lr = 0.001
optimizer = optim.SGD(my_net.parameters(), lr=lr, momentum=0.9, weight_decay=1e-6)
scheduler = lr_scheduler.CosineAnnealingLR(optimizer=optimizer, T_max=n_epoch, eta_min=lr / 100)
loss_classification = torch.nn.CrossEntropyLoss()

if cuda:
    my_net = my_net.cuda()
    loss_classification = loss_classification.cuda()

Resume = True
start_epoch = -1
if Resume:
    path_checkpoint = 'mySavepthPath.pth'
    checkpoint = torch.load(path_checkpoint, map_location=torch.device('cuda'))
    my_net.load_state_dict(checkpoint['model'])
    optimizer.load_state_dict(checkpoint['optimizer'])
    start_epoch = checkpoint['epoch']
    print("start_epoch:", start_epoch)
    print('-----------------------------')


for p in my_net.parameters():
    p.requires_grad = True

bestacc = 0.0
savepth = 'mySavepthPath'

new_start = 0 if start_epoch == -1 else start_epoch
for epoch in range(start_epoch + 1, new_start+n_epoch):
    my_net.train()
    ....
    if acc > bestacc:
        save_dict = {
            'epoch': epoch,
            'model': my_net.state_dict(),
            'optimizer': optimizer.state_dict()
        }
        torch.save(save_dict, savepth + '.pth')

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pytorch

深度学习

python

Pytorch模型保存与加载模型继续训练的相关文章

无法“安装”plpython3u - postgresql

我正在尝试在 postgresql 中使用 python 语言像这样的事情 create or replace function test a integer returns integer as if a 2 0 return even
使 django 服务器可以在 LAN 中访问

我已经安装了Django服务器可以如下访问 http localhost 8000 get sms http 127 0 0 1 8000 get sms 假设我的IP是x x x x 当我这样做时从同一网络下的另一台电脑 my ip
使用 matplotlib 绘制时间序列数据并仅在年初显示年份

rcParams date autoformatter month b n Y 我正在使用 matpltolib 来绘制时间序列如果我按上述方式设置 rcParams 则生成的图会在每个刻度处标记月份名称和年份我怎样才能将其设置为仅在每
从字符串中删除识别的日期

作为输入我有几个包含不同格式日期的字符串例如彼得在16 45 我的生日是1990年7月8日 On 7 月 11 日星期六我会回家 I use dateutil parser parse识别字符串中的日期在下一步中我想从字符串中删除
python 相当于 R 中的 get() （= 使用字符串检索符号的值）

在 R 中 get s 函数检索名称存储在字符变量向量中的符号的值s e g X lt 10 r lt XVI s lt substr r 1 1 X get s 10 取罗马数字的第一个符号r并将其转换为其等效整数尽管花了一些时间翻
以编程方式停止Python脚本的执行？ [复制]

这个问题在这里已经有答案了是否可以使用命令在任意行停止执行 python 脚本 Like some code quit quit at this point some more code that s not executed sys e
Python pickle：腌制对象不等于源对象

我认为这是预期的行为但想检查一下也许找出原因因为我所做的研究结果是空白我有一个函数可以提取数据创建自定义类的新实例然后将其附加到列表中该类仅包含变量然后我使用协议 2 作为二进制文件将该列表腌制到文件中稍后我重新运行脚本
如何在Python中获取葡萄牙语字符？

我正在研究葡萄牙语角色看起来很奇怪我怎样才能解决这个问题代码 import feedparser import random Vou definir os feeds feeds conf feedurl http pplware s
如何在ipywidget按钮中显示全文？

我正在创建一个ipywidget带有一些文本的按钮但按钮中未显示全文我使用的代码如下 import ipywidgets as widgets from IPython display import display button wid
在Python中获取文件描述符的位置

比如说我有一个原始数字文件描述符我需要根据它获取文件中的当前位置 import os psutil some code that works with file lp lib open path to file p psutil Pro
IO 密集型任务中的 Python 多线程

建议仅在 IO 密集型任务中使用 Python 多线程因为 Python 有一个全局解释器锁 GIL 只允许一个线程持有 Python 解释器的控制权然而多线程对于 IO 密集型操作有意义吗 https stackoverflow c
无法在 Python 3 中导入 cProfile

我试图将 cProfile 模块导入 Python 3 3 0 但出现以下错误 Traceback most recent call last File
使用 \r 并打印一些文本后如何清除控制台中的一行？

对于我当前的项目有一些代码很慢并且我无法使其更快为了获得一些关于已完成必须完成多少的反馈我创建了一个进度片段您可以在下面看到当你看到最后一行时 sys stdout write r100 80 n I use 80覆盖最终剩余的
使用 Python 绘制 2D 核密度估计

I would like to plot a 2D kernel density estimation I find the seaborn package very useful here However after searching
Python：如何将列表列表的元素转换为无向图？

我有一个程序可以检索 PubMed 出版物列表并希望构建一个共同作者图这意味着对于每篇文章我想将每个作者如果尚未存在添加为顶点并添加无向边或增加每个合著者之间的权重我设法编写了第一个程序该程序检索每个出版物的作者列表并
使用 Python 的 matplotlib 选择在屏幕上显示哪些图形以及将哪些图形保存到文件中

我想用Python创建不同的图形matplotlib pyplot 然后我想将其中一些保存到文件中而另一些则应使用show 命令然而 show 显示all创建的数字我可以通过调用来避免这种情况close 创建我不想在屏幕上显示的绘图
从列表指向字典变量

假设你有一个清单 a 3 4 1 我想用这些信息来指向字典 b 3 4 1 现在我需要的是一个常规看到该值后在 b 的位置内读写一个值我不喜欢复制变量我想直接改变变量b的内容假设b是一个嵌套字典你可以这样做 reduce di
Python 类继承 - 诡异的动作

我观察到类继承有一个奇怪的效果对于我正在处理的项目我正在创建一个类来充当另一个模块的类的包装器我正在使用第 3 方 aeidon 模块用于操作字幕文件但问题可能不太具体以下是您通常如何使用该模块 project aeidon P
NotImplementedError：无法将符号张量 (lstm_2/strided_slice:0) 转换为 numpy 数组。时间

张量流版本 2 3 1 numpy 版本 1 20 在代码下面 define model model Sequential model add LSTM 50 activation relu input shape n steps n fe
Statsmodels.formula.api OLS不显示截距的统计值

我正在运行以下源代码 import statsmodels formula api as sm Add one column of ones for the intercept term X np append arr np ones 50

随机推荐

数据规约

主成分的计算步骤主成分的代码实现设置工作空间把数据及程序文件夹拷贝到F盘下再用setwd设置工作空间 setwd F 数据及程序 chapter4 示例程序数据读取 inputfile lt read csv data pri
z系列主板能装服务器系统吗,Intel Z390主板搭配8代酷睿现身：还能安装WIN7系统吗？...

Intel今年为发烧友带来了最多18核心的Core X系列搭配X299顶级主板主流领域则有最多6核心的八代酷睿Coffee Lake S 搭配Z370主板但坑爹的是尽管八代和六七代酷睿都是LGA1151接口但却被故意整成不兼容因
基于power bi上手业务数据可视化

分析背景偶然得到一份关于某连锁火锅品牌在2020年1月 8月的线上平台业务数据如下图心想正好利用这份数据模拟实际业务中基于数据库与bi工具实践开发可视化图表一开始考虑用tableau 因为在大学跟刚工作的时候曾系统学习使用过但
栈的链性表的c语言实现方式 linkstack.h 和 linkstack.c

linkstack h 文件 ifndef LINK STACK H define LINK STACK H include
数据库关系代数投影概念理解

关系R上的投影是从R 中选择出若干属性列组成新的关系记作 A R t A t R 其中A 为R 中的属性列投影操作是从列的角度进行的运算例3 查询学生的姓名和所在系即求Student关系在学生姓名和所在系两个属性上的投影 Sname
k8s集群新增节点

如何动态的为k8s集群增加worknode节点本文将详细介绍 kubeadm搭建k8集群详见 https blog csdn net wangqiubo2010 article details 101203625 一 VMWare xSp
每日算法题（Day5）----取石子

题目描述有一种有趣的游戏玩法如下玩家 2 人道具 N 颗石子规则游戏双方轮流取石子每人每次取走若干颗石子最少取 1 颗最多取 K 颗石子取光则游戏结束最后取石子的一方为胜假如参与游戏的玩家都非常聪明问最后谁会获胜
Linux Kafka 2.11-1.1.1 安装搭建

Kafka是最初由Linkedin公司开发是一个分布式支持分区的 partition 多副本的 replica 基于zookeeper协调的分布式消息系统它的最大的特性就是可以实时的处理大量数据以满足各种需求场景比如基于hadoop
iframe无边框实现
Android 11 绕过反射限制

1 问题出现的背景腾讯视频在集成我们 replay sdk 的时候发现这么个错误导致整个 db mock 功能完全失效 Accessing hidden field Landroid database sqlite SQLiteCurs
LeetCode1477-找两个和为目标值且不重叠的子数组

给你一个整数数组 arr 和一个整数值 target 请你在 arr 中找两个互不重叠的子数组且它们的和都等于 target 可能会有多种方案请你返回满足要求的两个子数组长度和的最小值请返回满足要求的最小长度和如果无法找到这样的
餐馆点餐系统（Java GUI + mysql）

餐馆点餐系统 Java GUI mysql 开发环境 eclipse mysql 开发语言 Java SQL 本系统采用MVC模式开发的果冻点餐系统适合Java初级选手学习本系统实现了用户注册登录点餐商家管理订单等一系列功能首先
crc32碰撞_hash碰撞的概率和可能性比你直觉中大得多

注这篇文章源自我10年前写的博客今天看到有人谈密码安全的再发一遍和大家讨论下我发现哪怕10年后这文章也没过时很多人还是没拎清冲突概率和样本空间的关系前段时间跟某大牛叽歪的时候被提到我写的一篇文章用CRC32实现短网址的一
基于Spring Boot的酒店客房管理系统

文章目录项目介绍主要功能截图后台前台部分代码展示设计总结项目获取方式作者主页超级无敌暴龙战士塔塔开简介 Java领域优质创作者简历模板学习资料面试题库关注我都给你文末获取源码联系项目介绍基于Spring
奇偶校验c语言ascii,奇偶校验（parity check）

parity check 奇偶校验 N a check made of computer data to ensure that the total number of bits of value 1 or 0 in each unit o
查看Linux的用户权限（转载）

转 Linux查看用户及其权限管理查看用户请打开终端输入命令 who am i 或者 who mom likes 输出的第一列表示打开当前伪终端的用户的用户名要查看当前登录用户的用户名去掉空格直接使用 whoami 即可第二列的
ASP.NET MVC - Model Binding

Http Request 到Input Model的绑定按照model的类型可分为四种情况 Primitive type Collection of primitive type Complex type Collection of com
ROC曲线-阈值评价标准

ROC曲线指受试者工作特征曲线接收器操作特性曲线 receiver operating characteristic curve 是反映敏感性和特异性连续变量的综合指标是用构图法揭示敏感性和特异性的相互关系它通过将连续变量设定出多个不
UE4导入3dmax模型并在场景中添加第三人称角色

1 3dmax安装Datasmith插件插件下载位置 https www unrealengine com zh CN datasmith plugins 2 3dmax导出模型 3 UE4导入模型从3dmax导出datasmith的格
Pytorch模型保存与加载模型继续训练

1 网络模型定义与模型参数保存定义网络模型与基本参数以及模型训练和模型保存使用torch save 方法保存模型在save dict 中可以保存epoch model optimizer scheduler loss等参数 my n

Pytorch模型保存与加载模型继续训练

1. 网络模型定义与模型参数保存

2. 加载模型继续训练

Pytorch模型保存与加载模型继续训练 的相关文章

随机推荐

热门标签

Pytorch模型保存与加载模型继续训练的相关文章