将嵌套循环计算转换为 Numpy 以加速

2024-05-11

我的Python程序的一部分包含以下代码段，其中一个新的网格是根据旧网格中找到的数据计算的。

网格是二维浮点数列表。该代码使用了三个 for 循环：

for t in xrange(0, t, step):
    for h in xrange(1, height-1):
        for w in xrange(1, width-1):
            new_gr[h][w] = gr[h][w] + gr[h][w-1] + gr[h-1][w] + t * gr[h+1][w-1]-2 * (gr[h][w-1] + t * gr[h-1][w])
    gr = new_gr

return gr

对于大网格和大量时间来说，代码非常慢t.

我尝试使用 Numpy 通过替换内部循环来加速此代码和：

J = np.arange(1, width-1)
new_gr[h][J] = gr[h][J] + gr[h][J-1] ...

但产生的结果（数组中的浮点数）大约比他们的列表计算对应物。

使用以下方法将浮点数列表转换为 Numpy 浮点数数组时，预计会出现什么精度损失np.array(pylist)然后进行计算？
我应该如何将三重 for 循环转换为漂亮且快速的 Numpy 代码？（或者还有其他显着加快代码速度的建议吗？）

If gr是浮点列表，如果您希望使用 NumPy 进行矢量化，第一步是转换gr到 NumPy 数组np.array() http://docs.scipy.org/doc/numpy/reference/generated/numpy.array.html.

接下来，我假设你有new_gr用形状的零点初始化(height,width)。在最里面的两个循环中执行的计算基本上表示2D convolution。所以，你可以使用signal.convolve2d http://docs.scipy.org/doc/scipy-0.16.0/reference/generated/scipy.signal.convolve2d.html具有适当的kernel。决定kernel，我们需要查看缩放因子并做出3 x 3将它们从内核中取出并对它们取反以模拟我们在每次迭代中所做的计算。因此，您将拥有一个矢量化解决方案，其中两个最里面的循环被删除以获得更好的性能，如下所示 -

import numpy as np
from scipy import signal

# Get the scaling factors and negate them to get kernel
kernel = -np.array([[0,1-2*t,0],[-1,1,0,],[t,0,0]])

# Initialize output array and run 2D convolution and set values into it
out = np.zeros((height,width))
out[1:-1,1:-1] = signal.convolve2d(gr, kernel, mode='same')[1:-1,:-2]

验证输出和运行时测试

定义函数：

def org_app(gr,t):
    new_gr = np.zeros((height,width))
    for h in xrange(1, height-1):
        for w in xrange(1, width-1):
            new_gr[h][w] = gr[h][w] + gr[h][w-1] + gr[h-1][w] + t * gr[h+1][w-1]-2 * (gr[h][w-1] + t * gr[h-1][w]) 
    return new_gr

def proposed_app(gr,t):
    kernel = -np.array([[0,1-2*t,0],[-1,1,0,],[t,0,0]])
    out = np.zeros((height,width))
    out[1:-1,1:-1] = signal.convolve2d(gr, kernel, mode='same')[1:-1,:-2]
    return out

Verify -

In [244]: # Inputs
     ...: gr = np.random.rand(40,50)
     ...: height,width = gr.shape
     ...: t = 1
     ...: 

In [245]: np.allclose(org_app(gr,t),proposed_app(gr,t))
Out[245]: True

Timings -

In [246]: # Inputs
     ...: gr = np.random.rand(400,500)
     ...: height,width = gr.shape
     ...: t = 1
     ...: 

In [247]: %timeit org_app(gr,t)
1 loops, best of 3: 2.13 s per loop

In [248]: %timeit proposed_app(gr,t)
10 loops, best of 3: 19.4 ms per loop

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

将嵌套循环计算转换为 Numpy 以加速的相关文章

为 Anaconda Python 安装 psycopg2

我有 Anaconda Python 3 4 但是每当我运行旧代码时我都会通过输入 source activate python2 切换到 Anaconda Python 2 7 我的问题是我为 Anaconda Python 3 4 安
通过最小元素比较对 5 个元素进行排序

我必须在 python 中使用元素之间的最小比较次数来建模对 5 个元素的列表进行排序的执行计划除此之外复杂性是无关紧要的结果是一个对的列表表示在另一时间对列表进行排序所需的比较我知道有一种算法可以通过 7 次比较总是在元素之间
使用带有关键字参数的 map() 函数

这是我尝试使用的循环map功能于 volume ids 1 2 3 4 5 ip 172 12 13 122 for volume id in volume ids my function volume id ip ip 我有办法做到这一点
如何在 Python 中检索 for 循环中的剩余项目？

我有一个简单的 for 循环迭代项目列表在某些时候我知道它会破裂我该如何退回剩余的物品 for i in a b c d e f g try some func i except return remaining items if s
PyUSB 1.0：NotImplementedError：此平台不支持或未实现操作

我刚刚开始使用 pyusb 基本上我正在玩示例代码here https github com walac pyusb blob master docs tutorial rst 我使用的是 Windows 7 64 位并从以下地址下载 z
如何替换 pandas 数据框列中的重音符号

我有一个数据框dataSwiss其中包含瑞士城市的信息我想用普通字母替换带有重音符号的字母这就是我正在做的 dataSwiss Municipality dataSwiss Municipality str encode utf 8 d
测试 python Counter 是否包含在另一个 Counter 中

如何测试是否是pythonCounter https docs python org 2 library collections html collections Counter is 包含在另一个中使用以下定义柜台a包含在计数器中b当且
如何在Python中获取葡萄牙语字符？

我正在研究葡萄牙语角色看起来很奇怪我怎样才能解决这个问题代码 import feedparser import random Vou definir os feeds feeds conf feedurl http pplware s
Draggable JS Bootstrap 模式 - 性能问题

对于工作中的项目我们在 JavaScript 中使用 Bootstrap Modal 窗口我们想让一些窗口可移动但我们遇到了 JQuery 的性能问题 myModal draggable handle modal header Exa
Python 的“zip”内置函数的 Ruby 等价物是什么？

Ruby 是否有与 Python 内置函数等效的东西zip功能如果不是做同样事情的简洁方法是什么一些背景信息当我试图找到一种干净的方法来进行涉及两个数组的检查时出现了这个问题如果我有zip 我可以写这样的东西 zip a b a
Pygame：有没有简单的方法可以找到按下的任何字母数字的字母/数字？

我目前正在开发的游戏需要让人们以自己的名义在高分板上计时我对如何处理按键有点熟悉但我只处理过寻找特定的按键有没有一种简单的方法可以按下任意键的字母而不必执行以下操作 for event in pygame event get if
使用 \r 并打印一些文本后如何清除控制台中的一行？

对于我当前的项目有一些代码很慢并且我无法使其更快为了获得一些关于已完成必须完成多少的反馈我创建了一个进度片段您可以在下面看到当你看到最后一行时 sys stdout write r100 80 n I use 80覆盖最终剩余的
Fabric env.roledefs 未按预期运行

On the 面料网站 http docs fabfile org en 1 10 usage execution html 给出这个例子 from fabric api import env env roledefs web hosts
对年龄列进行分组/分类

我有一个数据框说df有一个柱子 Ages gt gt gt df Age 0 22 1 38 2 26 3 35 4 35 5 1 6 54 我想对这个年龄段进行分组并创建一个像这样的新专栏 If age gt 0 age lt 2 the
为字典中的一个键附加多个值[重复]

这个问题在这里已经有答案了我是 python 新手我有每年的年份和值列表我想要做的是检查字典中是否已存在该年份如果存在则将该值附加到特定键的值列表中例如我有一个年份列表并且每年都有一个值 2010 2 2009 4 1989
类型错误：预期单个张量时的张量列表 - 将 const 与 tf.random_normal 一起使用时

我有以下 TensorFlow 代码 tf constant tf random normal time step batch size 1 1 我正进入状态TypeError List of Tensors when single Te
如何计算 pandas 数据帧上的连续有序值

我试图从给定的数据帧中获取连续 0 值的最大计数其中包含来自 pandas 数据帧的 id date value 列如下所示 id date value 354 2019 03 01 0 354 2019 03 02 0 354 201
Rocket UniData/UniVerse：ODBC 无法分配足够的内存

每当我尝试使用pyodbc连接到 Rocket UniData UniVerse 数据时我不断遇到错误 pyodbc Error 00000 00000 Rocket U2 U2ODBC 0302810 Unable to allocate
Python Selenium：如何在文本文件中打印网站上的值？

我正在尝试编写一个脚本该脚本将从 tulsaspca org 网站获取以下 6 个值并将其打印在 txt 文件中最终输出应该是 905 4896 7105 23194 1004 42000 放置的动物的 HTML span class
Statsmodels.formula.api OLS不显示截距的统计值

我正在运行以下源代码 import statsmodels formula api as sm Add one column of ones for the intercept term X np append arr np ones 50

随机推荐

R 中的输出，避免写“[1]”

I use print从 R 中的函数输出例如 print blah blah blah 这输出 1 blah blah blah 到控制台我怎样才能避免 1 和引号 Use cat Your string type cat查看帮助页面
Glassfish 3 有两种配置

我想在 Glassfish 3 1 中设置 JDBC 领域我正在关注这个博客http blog gamatam com 2009 11 jdbc realm setup with glassfish v3 html http blog g
ExtJS 4 用于选择所选值的组合框事件

由于某种原因我需要知道用户何时从组合框中选择了值即使它已经被选择仅当用户选择未选择的项目时选择事件才起作用我在组合框或选择器的文档中没有看到任何类似 itemclick 的事件有任何想法吗 ComboBox uses 绑定列表
如何检查当前日期并移至下一个日期

我遇到了一个我似乎无法理解的 python 问题不确定是否需要使用 if 语句但因为我是 python 新手所以我实际上不确定如何编写这个小问题事实上这就是我遇到的问题对于出发日历我希望 python 能够执行以下操作查看
为什么这不会绘制图像？

我想做的是当我运行应用程序时它会启动线程并且图像显示 3 秒 3000 毫秒然后线程停止运行图片路径正确图片文件存在线程本身运行但是图像似乎没有显示可能出什么问题了这是我的代码 package org main impo
如何获取右侧数据框中不在左侧数据框中的数据

我有两个数据帧我正在尝试输出其中一个数据帧中的数据而不是另一个数据帧中的数据我可以使用第一个数据帧中的数据但不能使用第二个数据帧中的数据 only new old merge new outer on Employee ID Ben
如何在 PercentRelativeLayout 中使用layout_aspectRatio？

我尝试在视图上实现 16 9 的纵横比PercentRelativeLayout https developer android com reference android support percent PercentRelativeLa
澄清创建临时表的连接顺序

我在 mysql 中有一个大型查询涉及将多个表连接在一起它太慢了所以我做了解释发现它正在创建一个临时表我怀疑它占用了大部分执行时间我找到了一些相关资料 mysql 文档 http dev mysql com doc refma
Mailgun 内联图像，它是如何工作的？

我正在使用 mailgun 并希望将图像添加到我的时事通讯中现在我这样做了 mg gt sendMessage domain array from gt email protected cdn cgi l email protection
Android Activity 重新创建自身

我的应用程序通常运行得很好直到我在特定设备上遇到奇怪的问题 App中有2个活动当我在 ActivityA 内启动 ActivityB 后 ActivityA 启动时没有问题但是当我通过按下硬件按钮或调用 finish 返回 Acti
keras 层教程和示例

我正在尝试编码和学习不同的神经网络模型我对输入维度有很多复杂性我正在寻找一些教程显示层的差异以及如何设置每个层的输入和输出 Keras 文档 https keras io layers core 向您展示所有input shape每层
对同一解决方案/git 存储库中的项目的 PackageReference

目前我正在尝试设置一个带有实现类库和抽象项目的解决方案我想在 nuget org 上找到这两个包通常当您只使用 ProjectReferences 时您只需指向 csproj 随机抽象
Angular 2 测试 ng-content

我想知道是否有办法测试ng content不创建宿主元素例如如果我有警报组件 Component selector app alert template div div
Rails 5 deviseomniauth-facebook 错误：抱歉，出了点问题

我按照 Devise 的官方指南从上到下本节 https github com plataformatec devise wiki OmniAuth Overview logout links My CALLBACK URL is http
`docker run` 输出到 bash 变量 - 奇怪的行为

我看到一些奇怪的行为从docker run到 bash 变量中简单的例子 bin bash PWD docker run rm ti ubuntu pwd 2 gt 1 also tried with PWD docker run wit
Kafka Streams 内部数据管理

在我的公司我们广泛使用 Kafka 但出于容错的原因我们一直使用关系数据库来存储多个中间转换和聚合的结果现在我们正在探索 Kafka Streams 作为一种更自然的方式来做到这一点通常我们的需求非常简单其中一个例子是监听输入
如何抑制 IE9 window.close() 确认消息

应用 window close 函数后 IE9 会引发您正在查看的网页正在尝试关闭消息有没有办法在不更改应用程序代码的情况下而是通过更改一些特定于 IE 的注册表项来抑制此消息如果窗口不是由脚本打开的 IE 不允许在没有确认的情况
iPhone X 上横向的 UICollectionView

当 iPhone X 横向使用时您应该检查 safeAreaInsets 以在左侧和右侧制作适当大的装订线 UITableView 有新的insetsContentViewsToSafeArea属性默认 true 自动将单元格内容保留在
BATCH - 从 Windows 命令行获取显示分辨率并设置变量

echo off set h wmic desktopmonitor get screenheight set w wmic desktopmonitor get screenwidth echo h echo w pause 而不是得到
将嵌套循环计算转换为 Numpy 以加速

我的Python程序的一部分包含以下代码段其中一个新的网格是根据旧网格中找到的数据计算的网格是二维浮点数列表该代码使用了三个 for 循环 for t in xrange 0 t step for h in xrange 1 hei

将嵌套循环计算转换为 Numpy 以加速

将嵌套循环计算转换为 Numpy 以加速 的相关文章

随机推荐

热门标签

将嵌套循环计算转换为 Numpy 以加速的相关文章