TensorFlow中重复训练和预测时如何避免OOM错误？

2023-12-03

我在 TensorFlow 中有一些代码，它采用一个基本模型，用一些数据对其进行微调（训练），然后使用该模型来predict()使用一些其他数据。所有这些都封装在一个main()模块的方法并且工作正常。

然而，当我在不同的基本模型上循环运行此代码时，我最终会在（例如 7 个基本模型）之后出现 OOM。这是预期的吗？我希望Python会在每次之后进行清理main()称呼。 TensorFlow 不这样做吗？我怎样才能强迫它呢？

Edit:这是一个 MWE，显示的不是 OOM 崩溃，而是内存消耗增加：

import gc
import os

import numpy as np
import psutil
import tensorflow as tf

tf.get_logger().setLevel("ERROR")  # Suppress "tf.function retracing" warnings
process = psutil.Process(os.getpid())
for i in range(100):
    (model := tf.keras.applications.mobilenet.MobileNet()).compile(loss="mse")
    history = model.fit(
        x=(x := tf.zeros((1, *model.input.shape[1:]))),
        y=(y := tf.zeros((1, *model.output.shape[1:]))),
        verbose=0,
    )
    prediction = model.predict(x)
    _ = gc.collect()
    # tf.keras.backend.clear_session()
    print(f"rss {i}: {process.memory_info().rss >> 20} MB")

在我的计算机（CPU）上，它打印

rss 0: 374 MB
rss 1: 438 MB
rss 2: 478 MB
rss 3: 517 MB
rss 4: 554 MB
rss 5: 588 MB
rss 6: 634 MB
rss 7: 669 MB
rss 8: 686 MB
rss 9: 726 MB
...
rss 30: 1386 MB
rss 31: 1413 MB
rss 32: 1445 MB
rss 33: 1476 MB
rss 34: 1506 MB
rss 35: 1536 MB
rss 36: 1568 MB
rss 37: 1597 MB
rss 38: 1630 MB
rss 39: 1662 MB
...

With tf.keras.backend.clear_session()未注释，它更好，但还不完美：

rss 0: 374 MB
rss 1: 420 MB
rss 2: 418 MB
rss 3: 450 MB
rss 4: 447 MB
rss 5: 469 MB
rss 6: 469 MB
rss 7: 475 MB
rss 8: 487 MB
rss 9: 494 MB
...
rss 40: 519 MB
rss 41: 516 MB
rss 42: 517 MB
rss 43: 520 MB
rss 44: 519 MB
rss 45: 519 MB
rss 46: 521 MB
rss 47: 517 MB
rss 48: 521 MB
rss 49: 521 MB
...
rss 90: 531 MB
rss 91: 531 MB
rss 92: 531 MB
rss 93: 531 MB
rss 94: 532 MB
rss 95: 532 MB
rss 96: 533 MB
rss 97: 534 MB
rss 98: 533 MB
rss 99: 533 MB

切换顺序gc.collect() and tf.keras.backend.clear_session()也没有帮助。

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

TensorFlow中重复训练和预测时如何避免OOM错误？的相关文章

让 VoiceChannel.members 和 Guild.members 返回完整列表的问题

每当我尝试使用 VoiceChannel members 或 Guild members 时它都不会提供适用成员的完整列表我从文本命令的上下文中获取 VoiceChannel 和 Guild 如下所示 bot command name
如何在 __init__ 中使用await设置类属性

我如何定义一个类await在构造函数或类体中例如我想要的 import asyncio some code class Foo object async def init self settings self settings setti
在 Python 中将列表元素作为单独的项目返回

Stackoverflow 的朋友们大家好我有一个计算列表的函数我想单独返回列表的每个元素如下所示接收此返回的函数旨在处理未定义数量的参数 def foo my list 1 2 3 4 return 1 2 3 4 列表中的元素数
VSCode Settings.json 丢失

我正在遵循教程并尝试将 vscode 指向我为 Scrapy 设置的虚拟工作区但是当我在 VSCode 中打开设置时工作区设置选项卡不在用户设置选项卡旁边我还尝试通过以下方式手动转到文件 APPDATA Code User s
从Django中具有外键关系的两个表中检索数据？ [复制]

这个问题在这里已经有答案了 This is my models py file from django db import models class Author models Model first name models CharFie
Python 3d 绘图设置固定色阶

我正在尝试绘制两个 3d 数组第一个数组的 z 值在范围内 0 15 0 15 第二个来自 0 001 0 001 当我绘图时色标自动遵循数据范围如何设置自定义比例我不想看到 0 001 的浅色而应该看到 0 15 的浅色如何修
Pycharm 在 os.path 连接上出现“未解析的引用”

将pycharm升级到2018 1 并将python升级到3 6 5后 pycharm报告未解析的引用 join 最新版本的 pycharm 不会显示以下行的任何警告 from os path import join expanduser
MongoEngine 查询具有以列表中指定的前缀开头的属性的对象的列表

我需要在 Mongo 数据库中查询具有以列表中任何前缀开头的特定属性的元素现在我有一段这样的代码 query mymodel terms term in query terms 并且这会匹配在列表 term 上有一个项目的对象该列表中的
Python 内置的 super() 是否违反了 DRY？

显然这是有原因的但我没有足够的经验来认识到这一点这是Python中给出的例子docs http docs python org 2 library functions html super class C B def method se
Java 和 Python 可以在同一个应用程序中共存吗？

我需要一个 Java 实例直接从 Python 实例数据存储中获取数据我不知道这是否可能数据存储是否透明唯一或者每个实例如果它们确实可以共存都有其单独的数据存储总结一下 Java 应用程序如何从 Python 应用程序的数据存
使用 python/numpy 重塑数组

我想重塑以下数组 gt gt gt test array 11 12 13 14 21 22 23 24 31 32 33 34 41 42 43 44 为了得到 gt gt gt test2 array 11 12 21 22 13 14
导入错误：没有名为flask.ext.login的模块

我的flask login 模块有问题我已经成功安装了flask login模块另外从命令提示符我可以轻松运行此脚本不会出现错误 Python 2 7 r27 82525 Jul 4 2010 07 43 08 MSC v 1500
无法导入 langchain.agents.load_tools

我正在尝试使用 LangChain Agents 但无法导入 load tools 版本 langchain 0 0 27 我尝试过这些 from langchain agents import initialize agent from
未知错误：Chrome 无法启动：异常退出

当我使用 chromedriver 对 Selenium 运行测试时出现此错误 selenium common exceptions WebDriverException Message unknown error Chrome fail
通过Python连接到Bigquery：ProjectId和DatasetId必须非空

我编写了以下脚本来通过 SDK 将 Big Query 连接到 Python 如下所示 from google cloud import bigquery client bigquery Client project My First Pr
Python - 如何确定解析的 XML 元素的层次结构级别？

我正在尝试使用 Python 解析 XML 文件中具有特定标记的元素并生成输出 excel 文档该文档将包含元素并保留其层次结构我的问题是我无法弄清楚每个元素解析器在其上迭代的嵌套深度 XML 示例摘录 3 个元素它们可以任意嵌套
Protobuf 如何编码 oneof 消息结构

对于这个 python 程序在编码时运行 protobuf 编码会给出以下输出 0a 10 08 7f8a 0104 08 02 10 0392 0104 08 02 10 03 18 01 我不明白的是为什么8a后面有一个01 为什么9
Spider 必须返回 Request、BaseItem、dict 或 None，已“设置”

我正在尝试从以下位置下载所有产品的图像我的蜘蛛看起来像 from shopclues items import ImgData import scrapy class multipleImages scrapy Spider name m
如果 PyPy 快 6.3 倍，为什么我不应该使用 PyPy 而不是 CPython？

我已经听到很多关于PyPy http en wikipedia org wiki PyPy项目他们声称它比现有技术快 6 3 倍CPython http en wikipedia org wiki CPython口译员开启他们的网站 ht
如何使用 Boto3 启动具有 IAM 角色的 EC2 实例？

我无法弄清楚如何使用指定的 IAM 角色在 Boto3 中启动 EC2 实例以下是迄今为止我如何成功创建实例的一些示例代码 import boto3 ec2 boto3 resource ec2 region name us west 2

随机推荐

keytool 和 openssl 证书指纹不匹配

我试图在 META INF 内对 Android 开发者证书进行指纹识别以用于研究目的我发现在某些情况下 keytool 和 openssl 的输出会给我同一证书提供不同的 SHA1 指纹使用密钥工具 keytool princert
OpenMP 开销计算

给定 n 个线程有没有一种方法可以计算在 OpenMP 中实现特定指令所需的开销量例如周期数例如给出下面的代码 pragma omp parallel pragma omp for for int i 0 i lt m i a i
安装allure pytest适配器后出错

我正在尝试在 Windows 8 机器上使用 Pytest 3 6xx 配置 Allure 2 6 0 我能够运行 pytest 并生成 jUnit xml 报告文件稍后我可以将其传递给 allure allure 服务器 jUnitXm
是否可以检测用户何时切换到不同的浏览器选项卡？

我试图检测用户何时从当前浏览器选项卡切换到另一个选项卡监听 window onblur 在 Firefox 中可以很好地检测用户何时将焦点切换到另一个窗口但当用户切换到另一个选项卡时它似乎不会触发然而当从另一个选项卡切换到有问题的选
Web 服务请求调用 SOAP 请求缺少空参数

我对 Web 服务和 C 都很陌生所以如果我的问题太简单请原谅我我四处搜寻但找不到答案至少根据我的关键词找到了答案我尝试通过 C Visual Web Developer 2010 Express 调用 Web 服务但收到错误
Coldfusion 中的哈希用于安全支付网关

我正在尝试在 Coldfusion 中创建一个哈希密码以便我们的安全支付网关接受交易不幸的是支付网关拒绝接受我生成的哈希值该表单发送交易的所有元素并发送基于五个不同字段生成的哈希值在 PHP 中它是我认为 Coldfusion
Java Web 应用程序指定入口点

我有一些 Java Web 应用程序现在它从 index jsp 页面开始我有自己的课程代码如下 import java io import javax servlet import javax servlet http public
当我尝试将双精度型转换为浮点数时，为什么会出现错误？

我在将双精度型转换为浮点数时遇到了一些问题代码 float volume 0 5 Double i Volume Value volume float i 100F Bass BASS SetVolume volume 正如你所看到的我
Visual Studio 中的 aspx 页面设计视图有用吗？

我从来没有真正发现 Visual Studio 中的设计视图在开发 aspx 页面时有用所以我基本上从不使用它我是否遗漏了某些东西或者这只是那些不是特别有用的功能之一你使用设计视图吗如果是这样你觉得它有用吗如果没有为什么不呢
如何根据XML文件自动生成WPF控件？

我有一个 Xml 文件它告诉我必须添加到表单中的控件但此 Xml 会动态更改我需要更新表单目前我可以读取XML文件但我不知道是否可以基于该文件自动创建表单对的这是可能的 WPF 提供了多种在 Xaml 或代码中创建控件的方法
Excel 的独立代码

Can VBA编写代码以对任何操作执行操作Excel file 当我在中创建项目时视觉工作室它要求一个Excel要链接到它的文件我写的所有代码都在ThisWorkbook vb因此仅作用于Excel链接到项目的文件 Ideally I
如何全屏滑动选定的网格图像

我创建了一个网格视图图像应用程序我想在图像滑动中显示所选图像实际上我在我的应用程序中实现了图像滑动but问题是图像滑动从第一张图像开始而不是从选定的图像开始 example 如果我选择第三张图像则图像滑动应该从第三张图像开始而不是
缺少必需参数：aws_access_key_id、aws_secret_access_key

我目前正在尝试在终端中运行我的测试套件但出现以下错误 Missing required arguments aws access key id aws secret access key ArgumentError 我在我的项目中使用 C
Android HttpClient：NetworkOnMainThreadException

我有下面的一些代码 protected void testConnection String url DefaultHttpClient httpclient new DefaultHttpClient HttpGet httpget ne
用户帐户“root”的指定密码无效，或无法连接到数据库服务器

我在 Windows Server 2012R2 上使用 Windows 平台安装程序 5 0 安装 WordPress 时遇到此错误目前我在该服务器上有一个带有 mySQL 的 php 站点运行良好几个月前作为设置该网站的一部分
正则表达式将给定单词替换为两侧的空格或根本不替换

我正在使用 PHP 中的一些代码从搜索引擎获取引用数据为我提供用户输入的查询然后我想从该字符串中删除某些停用词如果存在但是该单词两端可能有也可能没有空格例如我一直使用 str replace 删除一个单词如下所示 key
绘制图像分类模型的混淆矩阵

我用 keras 构建了一个图像分类 CNN 虽然模型本身运行良好它可以正确预测新数据但我在绘制模型的混淆矩阵和分类报告时遇到问题我使用 ImageDataGenerator 训练了模型 train path DATASET TRAI
我如何获取全局javascript变量中的ajax内容

我想将内容放入javascript全局定义的变量中我使用ajax调用获得的内容 http pastebin com TqiJx3PA 感谢您的任何建议 Pastebin 代码已经做到了这一点我猜你实际面临的问题是存在的因为你的 aja
字符串格式为 yyyy-MM-dd HH:mm:ss Iphone

我有一个 nsstring 见下文 NSString Mydate 9 8 2011 以月日年的格式我希望这个字符串的格式yyyy MM dd HH mm ss 例如 2011 09 08 15 51 57 这样我需要以后面的格式在标
TensorFlow中重复训练和预测时如何避免OOM错误？

我在 TensorFlow 中有一些代码它采用一个基本模型用一些数据对其进行微调训练然后使用该模型来predict 使用一些其他数据所有这些都封装在一个main 模块的方法并且工作正常然而当我在不同的基本模型上循环运行此代码时

TensorFlow中重复训练和预测时如何避免OOM错误？

TensorFlow中重复训练和预测时如何避免OOM错误？ 的相关文章

随机推荐

热门标签

TensorFlow中重复训练和预测时如何避免OOM错误？的相关文章