为什么 PyTorch 模型在模型内部采用多个图像尺寸？

2024-01-02

我在 PyTorch 中使用简单的对象检测模型，并使用 Pytorch 模型进行推理。

当我在代码上使用简单的迭代器时

for k, image_path in enumerate(image_list):
    image = imgproc.loadImage(image_path)
    print(image.shape)
    with torch.no_grad():
        y, feature = net(x)        
    result = image.cuda()

它打印我们的可变尺寸图像，例如

torch.Size([1, 3, 384, 320])

torch.Size([1, 3, 704, 1024])

torch.Size([1, 3, 1280, 1280])

因此，当我使用应用相同转换的 DataLoader 进行批量推理时，代码未运行。但是，当我将所有图像的大小调整为 600.600 时，批处理成功运行。

我有两个疑问，

首先，为什么 Pytorch 能够在深度学习模型中输入动态大小的输入，以及为什么动态大小的输入在批处理中失败。

PyTorch 有一个所谓的动态计算图 https://medium.com/intuitionmachine/pytorch-dynamic-computational-graphs-and-modular-deep-learning-7e7f89f18d1 (其他解释 https://ai.stackexchange.com/questions/3801/what-is-a-dynamic-computational-graph).

它允许神经网络的图在训练或推理过程中动态适应其输入大小，从一个输入到下一个输入。这是您在第一个示例中观察到的内容：提供图像作为大小张量[1, 3, 384, 320]到你的模型，然后另一个作为大小张量[1, 3, 384, 1024]等等，完全没问题，因为对于每个输入，您的模型都会动态适应。

但是，如果您的输入实际上是输入的集合（一批），那就是另一回事了。对于 PyTorch，一批将被转换为具有一个额外维度的单个张量输入。例如，如果您提供 n 个图像的列表，每个图像的大小[1, 3, 384, 320]，PyTorch 会将它们堆叠在一起，以便您的模型具有单个张量输入，其形状[n, 1, 3, 384, 320].

这种“堆叠”只能发生在相同形状的图像之间。为了提供比之前的答案更“直观”的解释，这种堆叠操作不能在不同形状的图像之间完成，因为网络无法“猜测”不同图像在一批中应该如何彼此“对齐”，如果它们不是全部大小相同。

无论是在训练还是测试期间发生，如果您使用不同大小的图像创建批次，PyTorch 都会拒绝您的输入.

通常使用几种解决方案：像您一样进行重塑、添加填充（通常在图像边框上添加较小的值或空值）以将较小的图像扩展到最大图像的大小，等等。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么 PyTorch 模型在模型内部采用多个图像尺寸？的相关文章

如何在刻度标签和轴之间添加空间

我已成功增加刻度标签的字体但现在它们距离轴太近了我想在刻度标签和轴之间添加一点呼吸空间如果您不想全局更改间距通过编辑 rcParams 并且想要更简洁的方法请尝试以下操作 ax tick params axis both whic
Python PAM 模块的安全问题？

我有兴趣编写一个 PAM 模块该模块将利用流行的 Unix 登录身份验证机制我过去的大部分编程经验都是使用 Python 进行的并且我正在交互的系统已经有一个 Python API 我用谷歌搜索发现pam python http pa
DreamPie 不适用于 Python 3.2

我最喜欢的 Python shell 是DreamPie http dreampie sourceforge net 我想将它与 Python 3 2 一起使用我使用了添加解释器 DreamPie 应用程序并添加了 Python 3 2
更改自动插入 tkinter 小部件的文本颜色

我有一个文本框小部件其中插入了三条消息一条是开始消息一条是结束消息一条是在单位被摧毁时发出警报的消息我希望开始和结束消息是黑色的但被毁坏的消息参见我在代码中评论的位置插入小部件时颜色为红色我不太确定如何去做这件事我看
如何在Windows上模拟socket.socketpair

标准Python函数套接字套接字对 https docs python org 3 library socket html socket socketpair不幸的是它在 Windows 上不可用从 Python 3 4 1 开始我
Python tcl 未正确安装

我刚刚为 python 安装了graphics py 但是当我尝试运行以下代码时 from graphics import def main win GraphWin My Circle 100 100 c Circle Point 50
运行多个 scrapy 蜘蛛的正确方法

我只是尝试使用在同一进程中运行多个蜘蛛新的 scrapy 文档 http doc scrapy org en 1 0 topics practices html但我得到 AttributeError CrawlerProcess objec
从列表中的数据框列中搜索部分字符串匹配 - Pandas - Python

我有一个清单 things A1 B2 C3 我有一个 pandas 数据框其中有一列包含用分号分隔的值某些行将包含与上面列表中的一项的匹配它不会是完美的匹配因为它在其中包含字符串的其他部分该列例如该列中的一行可能有哇这里
NameError：名称“urllib”未定义”

CODE import networkx as net from urllib request import urlopen def read lj friends g name fetch the friend list from Liv
PyTorch 中的后向函数

我对 pytorch 的后向功能有一些疑问我认为我没有得到正确的输出 import numpy as np import torch from torch autograd import Variable a Variable torch
当玩家触摸屏幕一侧时，如何让 pygame 发出警告？

我使用 pygame 创建了一个游戏当玩家触摸屏幕一侧时我想让 pygame 给出类似你不能触摸屏幕两侧的错误我尝试在互联网上搜索但没有找到任何好的结果我想过在屏幕外添加一个方块当玩家触摸该方块时它会发出警告但这花了很长
HTTPS 代理不适用于 Python 的 requests 模块

我对 Python 还很陌生我一直在使用他们的 requests 模块作为 PHP 的 cURL 库的替代品我的代码如下 import requests import json import os import urllib impor
如何将 numpy.matrix 提高到非整数幂？

The 运算符为numpy matrix不支持非整数幂 gt gt gt m matrix 1 0 0 5 0 5 gt gt gt m 2 5 TypeError exponent must be an integer 我想要的是 oct
Python：尝试检查有效的电话号码

我正在尝试编写一个接受以下格式的电话号码的程序XXX XXX XXXX并将条目中的任何字母翻译为其相应的数字现在我有了这个如果启动不正确它将允许您重新输入正确的数字然后它会翻译输入的原始数字我该如何解决 def main phon
Python - 按月对日期进行分组

这是一个简单的问题起初我认为很简单而忽略了它一个小时过去了我不太确定所以我有一个Python列表datetime对象我想用图表来表示它们 x 值是年份和月份 y 值是此列表中本月发生的日期对象的数量也许一个例子可以更好地证明这
VSCode：调试配置中的 Python 路径无效

对 Python 和 VSCode 以及 stackoverflow 非常陌生直到最近我已经使用了大约 3 个月一切都很好当尝试在调试器中运行任何基本的 Python 程序时弹出窗口The Python path in your
在 Pandas DataFrame Python 中添加新列[重复]

这个问题在这里已经有答案了例如我在 Pandas 中有数据框 Col1 Col2 A 1 B 2 C 3 现在如果我想再添加一个名为 Col3 的列并且该值基于 Col2 式中如果Col2 gt 1 则Col3为0 否则为1 所以
如何使用google colab在jupyter笔记本中显示GIF？

我正在使用 google colab 想嵌入一个 gif 有谁知道如何做到这一点我正在使用下面的代码它并没有在笔记本中为 gif 制作动画我希望笔记本是交互式的这样人们就可以看到代码的动画效果而无需运行它我发现很多方法在 Goo
在 Python 类中动态定义实例字段

我是 Python 新手主要从事 Java 编程我目前正在思考Python中的类是如何实例化的我明白那个 init 就像Java中的构造函数然而有时 python 类没有 init 方法在这种情况下我假设有一个默认构造函数就像
改变字典的哈希函数

按照此question https stackoverflow com questions 37100390 towards understanding dictionaries 我们知道两个不同的字典 dict 1 and dict 2例

随机推荐

在 Windows 上读取名称中包含非 ASCII 字符的文件

我想用 R 处理大量文件其中一些文件的名称中包含非 ASCII 字符如下所示 2002 88 2 St pniewski txt 2003 100 2 3 Sa dou txt 但是我无法正确读取文件名list files gt fi
tibco 对组织有何用处以及为何使用它？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我对学习 tibco 很感兴趣我在 youtube 上找到了一些不错的视频但所有这些都只是教程没有一个视频回答为什么在组织中使用 tibc
在哪里将 Google 分析代码添加到 php 网站

将 Google 分析代码添加到 PHP 网站时我是否仅将代码添加到索引页面创建的每个页面或仅添加到客户旅程中的前端页面最佳实践是什么感谢您提前回复您想要分析的所有页面请在前面的页面上添加代码最佳实践是创建一个文件 analy
如何根据多态关联类型（Rails）应用不同的验证规则？

我有 Rails 多态模型我想根据关联类类名位于 type例如以下设置中的列 class Comment belongs to commentable polymorphic gt true end class Post has man
应用程序创建的线程如何被视为与应用程序的 ContentProvider 不同的应用程序？

我有一个应用程序当收到通知时ContentObserver更改为ContentProvider 尝试在后台线程上查询提供程序这会导致SecurityException被抛出 8 10 15 54 29 577 3057 3200 com
如何防止我的打包函数被 ls() 列出？ [关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案我成功构建并安装了 R 包加载后其中的所有函数都导出到全局环境并且可以从ls 我怎样才能防止这种情况让它们像 CRAN 上
如何防止后台附件：固定；我的网站滞后？

我正在使用背景附件固定在我的网站上但它导致 Chrome 对某些用户来说滞后有没有办法既能达到同样的效果又不会造成延迟自从我删除它以来延迟已经停止了但我更喜欢我网站的外观它实际上是一个已知错误 https code goog
来自列表/字典/列表的 Pandas DataFrame

我有一些这种形式的数据 a table a field apple pear table b field grape berry 我想创建一个如下所示的数据框 field table 0 apple a 1 pear a 2 grape b
在 Java 中使用 JTable 显示 MySQL 数据库中的记录

我想连接一个JTable to a ResultSet来自 MySQL 数据库这样我就可以查看数据我正在寻找一些描述此任务的链接或代码片段我正在使用 Netbeans IDE 下面的类将完成将数据从 MySQL 数据库读取到数据库时所
如何使用带有按钮的角度材质选择（没有表单字段）

我想使用有角的材料mat select组件没有mat form field 我希望它在概念上类似于本机选择元素有办法实现吗一个简单的方法是使用mat menu并在单击按钮时更新触发器使用 mat menu 组件的演示 https st
vb6: 当尝试在另一个项目中使用时，错误控件 xxx 的类 xxx 不是加载的控件类

在一个 vb6 项目中我创建了一个用户控件并放入了一个表单当我尝试在另一个项目中使用该表单与我的控件一起时 IDE 给出错误控件 xxx 的类 xxx 不是加载的控件类我在网络上进行了研究但没有找到解决方案谢谢首先您需要
使用 PHP 进行视频编辑

是否可以使用 PHP 将声音录制到上传的视频上你可以使用 MLT 库和我的课程您可以从此链接下载https github com 1fer mlt https github com 1fer mlt Features 剪切和合并视频通
AVQueuePlayer 的预缓冲

有谁知道如果AVQueuePlayer开始缓冲下一个AVPlayerItem当前项目何时即将结束播放我知道文档中没有任何内容表明这一点我主要是问是否有人观察到这种行为好的我再次查看了这个问题并编写了一些代码来检查AVQueuePla
FFmpeg 和黑白转换 [关闭]

Closed 这个问题是与编程或软件开发无关 help closed questions 目前不接受答案如何使用将视频转换为黑白ffmpeg 去饱和 Use the 色调滤镜 https ffmpeg org ffmpeg filters
如何在 Spring Web 应用程序中实现文件夹上传？

我想在我的网络应用程序中实现类似于 Google Drive 风格的文件目录上传我认为这是解释我想要的最好的例子所以我想上传单个文件多个选定的文件选定的文件夹其中包含的所有文件在客户端我想我必须使用 HTML5 我错了吗但
jQuery DateTimePicker 在输入模糊时减去一小时

我有一个奇怪的恼人的问题 This jQuery 日期时间选择器 https xdsoft net jqplugins datetimepicker 输入减去 1 小时blur 仔细看选择日期然后选择时间在您将焦点移出输入字段之前它
DropDownListFor 从模型中默认选择的项目

我有一个绑定到模型成员的 DropDownListFor 以及可供选择的项目列表与该成员的绑定有效但我似乎无法弄清楚如何在页面加载时显示模型的当前值 View Html DropDownListFor model gt model Me
如何消除同名类型和模块的歧义？

我正在尝试使用 K roly L rentey 的基于B树OrderedSet https github com lorentey BTree在一个项目中但是我遇到了一个问题我无法声明不合格OrderedSet
Angular DI：将价值代币注入工厂提供者

是否可以将 InjectionToken 注入工厂提供程序目前我已经编码 export const HOST TOKEN new InjectionToken
为什么 PyTorch 模型在模型内部采用多个图像尺寸？

我在 PyTorch 中使用简单的对象检测模型并使用 Pytorch 模型进行推理当我在代码上使用简单的迭代器时 for k image path in enumerate image list image imgproc loadIm

为什么 PyTorch 模型在模型内部采用多个图像尺寸？

为什么 PyTorch 模型在模型内部采用多个图像尺寸？ 的相关文章

随机推荐

热门标签

为什么 PyTorch 模型在模型内部采用多个图像尺寸？的相关文章