使用 Numpy 进行多维批量图像卷积

2024-05-14

在图像处理和分类网络中，一个常见的任务是输入图像与一些固定滤波器的卷积或互相关。例如，在卷积神经网络（CNN）中，这是一种极其常见的操作。我已将通用版本任务减少为：

Given：一批 N 个图像 [N,H,W,D,...] 和一组 K 个滤镜 [K,H,W,D,...]

Return：一个 ndarray，表示 N 中的每个 N_i 和 K 中的 K_j 的图像 N_i 与滤波器 K_j 的 m 维互相关 (xcorr)

现在，我在自定义函数上使用 scipy.spatial.cdist，该函数表示两个 m-dim 图像的 xcorr 的最大值，即 scipy.signal.correlate。代码看起来像这样：

from scipy.spatial.distance import cdist
from scipy.signal import correlate

def xcorr(u,v):
    '''unfortunately, cdist only takes 2D arrays, so need to do this'''
    u = np.reshape(u, [96,96,3])
    v = np.reshape(v, [96,96,3])
    return np.max(correlate(u,v,mode='same',method='fft'))

batch_images = np.random.random([500,96,96,3])
my_filters = np.random.random([1000,96,96,3])

# unfortunately, cdist only takes 2D arrays, so need to do this
batch_vec = np.reshape(batch_images, [-1,np.prod(batch_images.shape[1:])])
filt_vec = np.reshape(my_filters, [-1,np.prod(my_filters.shape[1:])])

answer = cdist(batch_vec, filt_vec, xcorr)

该方法有效，而且 cdist 可以自动跨线程并行化，这很好，但实际上速度很慢。我猜测这是由于多种原因造成的，包括线程之间缓存的非最佳使用（例如，在过滤所有图像时将一个过滤器固定在缓存中，反之亦然）、xcorr 内部的重塑操作等。

社区有什么想法可以加快速度吗？我意识到在我的示例中 xcorr 取两个图像之间的互相关性的最大值，但这只是一个适合与 cdist 一起使用的示例。理想情况下，您可以执行此批处理操作并使用其他一些函数（或不使用）来获得您想要的输出。理想的解决方案可以处理（R、G、B、D……）数据。

尽管首选 Python/numpy 解决方案，但任何/所有帮助都值得赞赏，包括但不限于包装 C。我看到了一些与 einsum 表示法相关的帖子，但我对此不太熟悉，所以任何帮助将不胜感激。我欢迎张量流解决方案，如果它们能够获得与相应的慢速 numpy 版本相同的答案（在合理的精度内）。

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 Numpy 进行多维批量图像卷积的相关文章

在Python3.6中调用C#代码

由于完全不了解 C 编码我希望在我的 python 代码中调用 C 函数我知道有很多关于同一问题的问答但由于一些奇怪的原因我无法从示例 python 模块导入简单的 c 类库以下是我所做的事情 C 类库设置我使用的是 VS 20
python - 是否可以扩展 xml-rpc 可以序列化的事物集？

我看到几个问题询问如何发送numpy ndarray通过 xml rpc 调用这不能开箱即用因为正如 xml rpc 中所述docs https docs python org 2 library xmlrpclib html 有一组固
在python中将文本文件解析为列表

我对 Python 完全陌生我正在尝试读取包含单词和数字组合的 txt 文件我可以很好地读取 txt 文件但我正在努力将字符串转换为我可以使用的格式 import matplotlib pyplot as plt import num
python 中分割字符串以获得一个值？

需要帮助假设我在名为 input 的变量中有一个字符串 Sam Person name kind input split 通过执行上述操作我得到两个具有不同字符串 Sam 和 Person 的变量有没有办法只获取第一个值 name S
如何将十六进制数组转换为 UIImage？

有几个与使用 P25mi 动态打印图像相关的未解答问题没有一个得到公认的答案下面有几个链接如何将图像转换为位图代码以便在 iPhone 中进行蓝牙打印 https stackoverflow com questions 1383828
为什么 Python 中的“pip install”会引发语法错误？

我正在尝试使用 pip 安装软件包我试着跑pip install从Python shell 但我得到了SyntaxError 为什么我会收到此错误如何使用 pip 安装软件包 gt gt gt pip install selenium
更改 pandas 中多个日期时间列的时区信息

有没有一种简单的方法可以将数据帧中的所有时间戳列转换为本地任何时区不是逐列进行吗您可以有选择地将转换应用于所有日期时间列首先选择它们select dtypes https pandas pydata org pandas docs
Python 中的 @staticmethod 与 @classmethod

方法和方法有什么区别装饰的 https peps python org pep 0318 with staticmethod http docs python org library functions html staticmethod和
无法截取宽度为 0 的屏幕截图

我正在尝试截取 Bootstrap 模态内元素的屏幕截图经过一番努力我终于想出了这段代码 driver get https enlinea sunedu gob pe driver find element by xpath div c
在每次迭代中使用 for 循环的索引命名图像

我正在使用 MATLAB 进行图像处理项目我使用 for 循环在每次循环迭代时生成某种图像数据图像大小不同我的问题是如何阻止它在下一次迭代中覆盖图像 Img i j data 理想情况下我希望它有 Img 1 data for 1st
conda-env list / conda info --envs 如何查找环境？

我一直在尝试 anaconda miniconda 因为我的用户使用随 miniconda 安装的结构生物学程序并且作者都没有 A 考虑到可能存在其他 miniconda 应用程序 B 他们的程序将在多用户环境中使用因此使用 Arch
select() 可以在 Windows 下使用 Python 中的文件吗？

我正在尝试在 Windows 下运行以下 python 服务器 An echo server that uses select to handle multiple clients at a time Entering any line o
将一个列表的元素除以另一个列表的元素

我有两个清单比如说 a 10 20 30 40 50 60 b 30 70 110 正如你所看到的列表 b 由一个列表的元素总和组成其中 window 2 b 0 a 0 a 1 10 20 30 etc 如何获得另一个列表该列表由
张量流：注册 numpy bfloat16 扩展

正如我所见 tensorflow 中有 bfloat16 的 numpy 扩展 https github com tensorflow tensorflow blob 24ffe9f729160a095a5cab8f592392018280
Python组合目录中的所有csv文件并按日期时间排序

我有 2 年的每日数据分成每月文件我想将所有这些数据合并到一个按日期和时间排序的文件中我正在使用的代码组合了所有文件但不按顺序我正在使用的代码 import pandas as pd import glob os import cs
Python 3.2 中 **kwargs 和 dict 有什么区别？

看起来Python的很多方面都只是功能的重复除了我在 Python 中的 kwargs 和 dict 中看到的冗余之外还有什么区别吗参数解包存在差异许多人使用kwargs 并通过dict作为论据之一使用参数解包 Prepare f
如何禁止 celery 中的 pickle 序列化

Celery 默认使用 pickle 作为任务的序列化方法如中所述FAQ http ask github com celery faq html isn t using pickle a security concern 这代表一个安全漏
检查字符串是否只有字母和空格 - Python

试图让 python 返回一个字符串仅包含字母和空格 string input Enter a string if all x isalpha and x isspace for x in string print Only alphabe
TypeError：无法使用抽象方法实例化抽象类 <...>

这是我的代码 from abc import ABC from abc import abstractmethod class Mamifiero ABC docstring for Mamifiero def init self self
在 Python 模块中使用 InstaLoader

我正在尝试使用 Instaloader 下载与主题标签相关的照片以进行图像分析我在GitHub存储库中找到了一个全面的方法如何在终端中执行它但是我需要将脚本集成到Python笔记本中这是脚本 instaloader no vide

随机推荐

vuetify 中的 v-app-bar 和 v-toolbar 有什么区别？

我刚刚开始探索vuetify http vuetifyjs com 所有 vuetify 组件都位于
如何禁用 YouTube Iframe 上的全屏？

我里面有一个 div 容器和 Iframe 我指定宽度 200 和高度 200 当我点击全屏时视频变得模糊且质量非常差所以我想看看是否可以在 YouTube iframe 上禁用全屏 I used controls 0在我的网址末尾
Android 从通知刷新 Activity

我有一个程序我在其中调用通知如果您将其下拉该通知将启动一个新活动 mNotificationManager NotificationManager getSystemService ns int icon R drawable sta
Android AppWidgetManager 方法 updateAppWidget 无法设置意图、加载数据。而且它是随机发生的

我的小部件由 2 个按钮和一个显示数据的列表视图组成大多数时候当调用小部件提供程序的 onUpdate 方法时一切都会正常加载每个人都很高兴但是我注意到有时在调用更新方法后小部件完全无法加载其数据列表视图为空所有按钮均无响应
动态 dom 操作后，如何在浏览器历史记录中保留 dom 状态？

是否有一个通用的解决方案来保留 dom 状态以便当用户使用后退前进返回页面时整个页面处于他们离开时的确切状态这篇文章询问并回答了为什么不同浏览器和不同 javascript 库的行为不一致 Ajax 后退按钮和 DOM 更新 htt
如何在运行仅 iPhone 应用程序（非通用）的 iPad 上的 UIPickerView 中支持 VoiceOver？

一般来说我会查看 Apple 的 UICatalog 示例代码以获取基本的 VoiceOver 支持但示例代码中似乎有对 UIPickerViews 的 VoiceOver 支持我是否需要在某处提供accessibilityLabel
WPF。如何从另一个窗口隐藏/显示主窗口

我有两个窗口 MainWindow 和 Login 显示登录的按钮位于主窗口 this Hide Login li new Login li Show 登录窗口上有一个检查密码的按钮如果密码正确我如何显示主窗口将参数传递给 MainW
动态更改按钮上的图像视图

在我的应用程序中我有按钮和ImageView 当我按下按钮时我想改变ImageView 我的可绘制文件夹中有 5 张图像按下按钮时 ImageView 根据按钮单击一张一张地更改图像我想要它的解决方案感谢任何可以提供帮助的人维护一
在firefox上用js改变表单方法

我需要使用 javascript jQuery 或纯更改表单的方法属性我的表单有 method post 我尝试用以下方法更改它 submit button click function var url input id url val
旧版本的 spaCy 在尝试安装模型时抛出“KeyError: 'package'”错误

我在 Ubuntu 14 04 4 LTS x64 上使用 spaCy 1 6 0 和 python3 5 为了安装 spaCy 的英文版本我尝试运行这给了我错误消息 ubun ner 3 NeuroNER master src pyt
带 getClassLoader 和不带 getClassLoader 的 getResourceAsStream 有什么区别？

我想知道以下两者之间的区别 MyClass class getClassLoader getResourceAsStream path to my properties and MyClass class getResourceAsStre
Android：透明活动问题

最近在我们的一款生产应用程序上透明活动已停止工作我的意思是它变成了黑色背景而不是透明背景当我将活动的背景颜色设置为纯色即红色绿色等时它的应用不会出现问题该问题可能是由于迁移到 AndroidX 引起的但我没有这方面的证据
Grails 中不区分大小写的唯一约束

我如何基本上对字符串数据类型字段执行唯一约束 class User String username String Email static hasMany roles Roles static constraints Email email
永远运行 Gulp 脚本？

是否可以运行 Gulp 脚本forever https www npmjs com package forever 我有 Gulp 脚本想要作为守护进程运行所以我可以启动停止列出它好的所以我通过将 gulp 二进制文件从 usr
在数组列表中过滤 Filterable 不取消之前的过滤

我看过过滤器方法文档其中显示调用过滤器会取消所有先前未执行的过滤请求并发布一个稍后将执行的新过滤请求但我收到的实际回调有些不同在我的实现中它不会取消先前的过滤器请求并调用publishResults 最近一次搜索条件后的上一次搜索
将 CCtray 与 Jenkins 结合使用，同时启用安全性（使用 HTTPS）

我将 Jenkins 服务器配置为仅使用 HTTPS 并启用安全性我也不喜欢任何未登录的人查看仪表板即使它是空的在这里我禁用了匿名的读取访问权限到目前为止所有这些都完全符合我的喜好但想要通过例如向远程客户端添加一些构建
使用 mingw32 在 Windows 上构建 glew 时“DllMainCRTStartup@12”的多个定义

我关注了这个主题使用 mingw 使建筑物在 Windows 上闪闪发光 https stackoverflow com questions 6005076 building glew on windows with mingw 6005
在桌面和移动设备上编写 2 列和 3 列的 Flexbox 代码（换行）

我真的很难弄清楚这个 CSS flexbox 解决方案基本上有两个问题一个是 2 列布局另一个是 3 列布局 2 列我认为这可能非常简单 3 列这可能更高级一些容器类是嗯 container 而孩子们只是 left right
DataTable：通过 LINQ 或 LAMBDA 进行动态 Group By 表达式

我有一个数据表我想在其中对未指定数量的字段进行分组发生这种情况的原因是用户可以选择他想要分组的字段所以实际上我将选择推入列表中在这个选择上我必须对我的数据表进行分组想象一下这段代码 VB 或 C 都一样 public voi
使用 Numpy 进行多维批量图像卷积

在图像处理和分类网络中一个常见的任务是输入图像与一些固定滤波器的卷积或互相关例如在卷积神经网络 CNN 中这是一种极其常见的操作我已将通用版本任务减少为 Given 一批 N 个图像 N H W D 和一组 K 个滤镜 K H W

使用 Numpy 进行多维批量图像卷积

使用 Numpy 进行多维批量图像卷积 的相关文章

随机推荐

热门标签

使用 Numpy 进行多维批量图像卷积的相关文章