在 PyTorch 中实现“无限循环”数据集和数据加载器

2023-12-22

我想实现一个无限循环数据集和数据加载器。这是我尝试过的：

class Infinite(Dataset):
    def __len__(self):
        return HPARAMS.batch_size
#         return 1<<30 # This causes huge memory usage.
    def __getitem__(self, idx):
        """Randomly generates one new example."""
        return sample_func_to_be_parallelized()

infinite_loader = DataLoader(
    dataset=Infinite(), 
    batch_size=HPARAMS.batch_size, 
    num_workers=16,
    worker_init_fn=lambda worker_id: np.random.seed(worker_id),  
)

while True:
    for idx, data in enumerate(infinite_loader):
        # forward + backward on "data"

正如您所看到的，这里的主要挑战是__len()__方法。如果我在那里放置足够大的数字，例如 1

如果我在那里放一个小数字，例如 1 或 BATCH_SIZE，则训练循环中的采样“数据”将定期重复。这不是我想要的，因为我希望在每次迭代时生成和训练新数据。

我猜内存使用过多的罪魁祸首是在堆栈中的某个地方，缓存了一堆东西。随便看看 Python 方面的东西，我无法确定它在哪里。

有人可以建议实现我想要的内容的最佳方法是什么吗？（使用Data Loader并行加载，同时保证加载的每个批次都是全新的。）

这似乎无需定期复制数据即可工作：

import numpy as np
import torch
from torch.utils.data import Dataset, DataLoader

BATCH_SIZE = 2

class Infinite(Dataset):

    def __len__(self):
        return BATCH_SIZE

    def __getitem__(self, idx):
        return torch.randint(0, 10, (3,))


data_loader = DataLoader(Infinite(), batch_size=BATCH_SIZE, num_workers=16)

batch_count = 0
while True:
    batch_count += 1
    print(f'Batch {batch_count}:')

    data = next(iter(data_loader))
    print(data)
    # forward + backward on "data"  

    if batch_count == 5:
        break

Result:

Batch 1:
tensor([[4, 7, 7],
        [0, 8, 0]])
Batch 2:
tensor([[6, 8, 6],
        [2, 6, 7]])
Batch 3:
tensor([[6, 6, 2],
        [8, 7, 0]])
Batch 4:
tensor([[9, 4, 8],
        [2, 4, 1]])
Batch 5:
tensor([[9, 6, 1],
        [2, 7, 5]])

所以我认为问题出在你的功能上sample_func_to_be_parallelized().

Edit: 如果代替torch.randint(0, 10, (3,)) I use np.random.randint(10, size=3) in __getitem__（作为一个例子sample_func_to_be_parallelized()），那么数据确实在每个批次中都是重复的。看到这个issue https://github.com/pytorch/pytorch/issues/5059.

所以如果你在你的某个地方使用 numpy 的 RGNsample_func_to_be_parallelized()，那么解决方法是使用

worker_init_fn=lambda worker_id: np.random.seed(np.random.get_state()[1][0] + worker_id)

并通过以下方式重置种子np.random.seed()每次调用之前data = next(iter(data_loader)).

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Pytorch

在 PyTorch 中实现“无限循环”数据集和数据加载器的相关文章

如何等到 Excel 计算公式后再继续 win32com

我有一个 win32com Python 脚本它将多个 Excel 文件合并到电子表格中并将其另存为 PDF 现在的工作原理是输出几乎都是 NAME 因为文件是在计算 Excel 文件内容之前输出的这可能需要一分钟如何强制工作簿计算值
在循环中每次迭代开始时将变量重新分配给原始值（在循环之前定义）

在Python中你使用在每次迭代开始时将变量重新分配给原始值在循环之前定义时也就是说 original 1D o o o for i in range 0 3 new original 1D revert back to orig
使用 Pycharm 在 Windows 下启动应用程序时出现 UnicodeDecodeError

问题是当我尝试启动应用程序 app py 时我收到以下错误 UnicodeDecodeError utf 8 编解码器无法解码位置 5 中的字节 0xb3 起始字节无效整个文件app py coding utf 8 from flask
IRichBolt 在storm-1.0.0 和 pyleus-0.3.0 上运行拓扑时出错

我正在运行风暴拓扑 pyleus verbose local xyz topology jar using storm 1 0 0 pyleus 0 3 0 centos 6 6并得到错误线程 main java lang NoClass
NameError：名称“urllib”未定义”

CODE import networkx as net from urllib request import urlopen def read lj friends g name fetch the friend list from Liv
Pandas Dataframe 中 bool 值的条件前向填充

问题如何转发 fill boolTruepandas 数据框中的值如果是当天的第一个条目 True 到一天结束时请参阅以下示例和所需的输出 Data import pandas as pd import numpy as np df
当玩家触摸屏幕一侧时，如何让 pygame 发出警告？

我使用 pygame 创建了一个游戏当玩家触摸屏幕一侧时我想让 pygame 给出类似你不能触摸屏幕两侧的错误我尝试在互联网上搜索但没有找到任何好的结果我想过在屏幕外添加一个方块当玩家触摸该方块时它会发出警告但这花了很长
Geopandas 设置几何图形：MultiPolygon“等于 len 键和值”的 ValueError

我有 2 个带有几何列的地理数据框我将一些几何图形从 1 个复制到另一个这对于多边形效果很好但对于任何有效多多边形都会返回 ValueError 请指教如何解决这个问题我不知道是否如何为什么应该更改 MultiPolygon
使用 OpenPyXL 迭代工作表和单元格，并使用包含的字符串更新单元格[重复]

这个问题在这里已经有答案了我想使用 OpenPyXL 来搜索工作簿但我遇到了一些问题希望有人可以帮助解决以下是一些障碍待办事项我的工作表和单元格数量未知我想搜索工作簿并将工作表名称放入数组中我想循环遍历每个数组项并搜索包含特
ExpectedFailure 被计为错误而不是通过

我在用着expectedFailure因为有一个我想记录的错误我现在无法修复但想将来再回来解决我的理解expectedFailure是它会将测试计为通过但在摘要中表示预期失败的数量为 x 类似于它如何处理跳过的 tets 但是当我
Python：尝试检查有效的电话号码

我正在尝试编写一个接受以下格式的电话号码的程序XXX XXX XXXX并将条目中的任何字母翻译为其相应的数字现在我有了这个如果启动不正确它将允许您重新输入正确的数字然后它会翻译输入的原始数字我该如何解决 def main phon
Python - 按月对日期进行分组

这是一个简单的问题起初我认为很简单而忽略了它一个小时过去了我不太确定所以我有一个Python列表datetime对象我想用图表来表示它们 x 值是年份和月份 y 值是此列表中本月发生的日期对象的数量也许一个例子可以更好地证明这
Numpy 优化

我有一个根据条件分配值的函数我的数据集大小通常在 30 50k 范围内我不确定这是否是使用 numpy 的正确方法但是当数字超过 5k 时它会变得非常慢有没有更好的方法让它更快 import numpy as np N 5000
为美国东部以外地区的 Cloudwatch 警报发送短信？

AWS 似乎没有为美国东部以外的 SNS 主题订阅者提供 SMS 作为协议我想连接我的 CloudWatch 警报并在发生故障时接收短信但无法将其发送到 SMS YES 经过一番挖掘后我能够让它发挥作用它比仅仅选择一个主题或输入闹钟
用于运行可执行文件的python多线程进程

我正在尝试将一个在 Windows 上运行可执行文件并管理文本输出文件的 python 脚本升级到使用多线程进程的版本以便我可以利用多个核心我有四个独立版本的可执行文件每个线程都知道要访问它们这部分工作正常我遇到问题的地方是当它们
Pytorch LSTM：计算交叉熵损失的目标维度

我一直在尝试在 Pytorch 中使用 LSTM LSTM 后跟自定义模型中的线性层但在计算损失时出现以下错误 Assertion cur target gt 0 cur target lt n classes failed 我用以下函数
Python：元类属性有时会覆盖类属性？

下面代码的结果让我感到困惑 class MyClass type property def a self return 1 class MyObject object metaclass MyClass a 2 print MyObject
改变字典的哈希函数

按照此question https stackoverflow com questions 37100390 towards understanding dictionaries 我们知道两个不同的字典 dict 1 and dict 2例
Python 分析：“‘select.poll’对象的‘poll’方法”是什么？

我已经使用 python 分析了我的 python 代码cProfile模块并得到以下结果 ncalls tottime percall cumtime percall filename lineno function 13937860 9
PyAudio ErrNo 输入溢出 -9981

我遇到了与用户相同的错误 Python 使用 Pyaudio 以 16000Hz 录制音频时出错 https stackoverflow com questions 12994981 python error audio recording

随机推荐

缩小和放大后 MapOverlay 闪烁 - iOS

我有两个问题首先一旦我为坐标分配内存请参阅下面的代码我是否必须释放内存坐标其次正如您在下面的代码中看到的我得到了叠加层并添加到地图上但是有不同的时间戳提要坐标应该更新地图就像雷达地图用不同的时间戳改变叠加形状一样它
在对话框中的 QTextEdit 中按 Tab - 更改行为

I have QDialog包含几个按钮和一个QTextEdit 在写了一些东西之后QTextEdit 我按 Tab 键以到达其中一个按钮但是当我按 Tab 键时会在QTextEdit 我怎样才能改变这种行为您可以使用设置TabCha
如何开始针对 Amazon Fire TV 进行开发？

我被要求开发一个 Amazon Fire TV 应用程序但我发现很难理解步入正轨所需的步骤根据亚马逊指定文档 https developer amazon com public solutions devices fire tv doc
我应该如何存储在 Google Cloud Platform 中使用的机密？

如果我需要将凭据存储在 Google Compute Engine 或 Google App Engine 中以便在构建时使用我应该如何存储它们还有什么比将它们存储在代码中或存储桶中更好的方法吗一种选择是使用 Cloud KMS 中的
使用 Twitter Bootstrap 触发导航选项卡的按钮

该按钮触发下一个选项卡加载内容但选项卡本身不会切换它保留在第一个选项卡上 br a class btn btn primary href tab2 Review a br 这是导航导航选项卡的代码 ul class nav nav ta
如何避免在控制台上打印系统日志的广播消息

我编写了一段小代码用于在连接到 postgres 数据库失败时使用 C Api 向系统日志发送消息 int main int argc char argv PGconn psql PGresult res int flag 0 openl
高分辨率下 Swing UI 缩放不良（MS Surface）

我目前正在开发一个涉及 Swing GUI 的小型 Java 应用程序在我的开发 PC 上一切看起来都很好但当我在 MS Surface 上运行它时某些图标对于组件来说似乎太大或者组件对于图标来说太小这就是我的意思 Google
Django 全文搜索按相关性顺序

我正在使用 Django 查询过滤器 search 来执行全文搜索例如 MyModel objects filter title search some title 我如何让它按相关性排序因为目前它似乎是按字母顺序排序的具体来说我想
Java Posix IPC 有API吗？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我想知道是否可以访问 Java 中的 Posix 消息队列因为我有一个无法修改并使用消息队列与其他进程
在 Typescript 中使用“--strictFunctionTypes”有什么好处？

据我了解 strictFunctionTypesTypescript 中的编译器选项阻止了一个非常常见的多态性用例的工作 type Handler request Request gt Response const myHandler Ha
如何使用Xamarin Android APK的.Net Reactor混淆dll

我是 Xamarin Android 新手我使用 Visual Studio 2015 社区版创建了一个应用程序我已将解决方案配置设置为发布为了进行混淆我使用了 Net Reactor 这就是我试图混淆的方式 1 构建应用程序后我
Common-Lisp 以函数格式打印制表符

我希望打印制表符format功能我可以通过以下方式实现这一点 C然后放置 tab作为格式的参数但这似乎有点冗长因为对于换行符可以简单地放置一个在字符串中使用打印标签最常用的做法是什么format功能感谢您的帮助中没有制表符的
在 CrossWalk 中迁移 Cordova 应用程序时出错

我在尝试着迁移科尔多瓦应用程序 in 人行横道 using 命令行工具如中给出的this https crosswalk project org documentation cordova migrate an application ht
在编译时计算一组常量表达式的最大值

我试图在 Rust 过程宏派生宏内的编译时计算一组常量的最大值该宏看起来像 fn get max len gt TokenStream Each TokenStream represents a constant expression
有关 mod_rewrite 和 mod_redirect 的帮助

我的 htaccess 文件是 Redirect 301 http domain com news articles dtMain start 150 http domain com news articles Redirect 301 h
如何使用 pandas read_xml API 读取大型 xml 文件？

我正在尝试读取一个大的 XML 文件文件大小约为 84 GB 来自 Post xml 的堆栈溢出数据转储我注意到有 Pandas API pandas read xml link https pandas pydata org pand
为什么内存块没有被垃圾收集器清理？

package main import fmt net http runtime func handler w http ResponseWriter r http Request largeMemAlloc make int 100000
创建具有像单例模式一样的可重用性的 CSOM ClientContext

我在不同的用户操作上调用了多种方法客户端上下文在每个方法执行上创建它都会导致性能问题所以我将其添加为静态变量以实现可重用性性能平均提高了 5 秒但随后在某些方法中它开始给出随机问题版本冲突 on 执行查询但如果我删除静态和空检查
将 GoDaddy 裸域添加到 Heroku 应用程序

Heroku 自定义域 https devcenter heroku com articles custom domains 我已经设置了two我的 Heroku 应用程序的自定义域 example com example com hero
在 PyTorch 中实现“无限循环”数据集和数据加载器

我想实现一个无限循环数据集和数据加载器这是我尝试过的 class Infinite Dataset def len self return HPARAMS batch size return 1 lt lt 30 This causes

在 PyTorch 中实现“无限循环”数据集和数据加载器

在 PyTorch 中实现“无限循环”数据集和数据加载器 的相关文章

随机推荐

热门标签

在 PyTorch 中实现“无限循环”数据集和数据加载器的相关文章