numpy 中计算距离的更有效方法？

2024-01-08

我有一个关于如何尽可能快地计算 numpy 距离的问题，

def getR1(VVm,VVs,HHm,HHs):
    t0=time.time()
    R=VVs.flatten()[numpy.newaxis,:]-VVm.flatten()[:,numpy.newaxis]
    R*=R
    R1=HHs.flatten()[numpy.newaxis,:]-HHm.flatten()[:,numpy.newaxis]
    R1*=R1
    R+=R1
    del R1
    print "R1\t",time.time()-t0, R.shape, #11.7576191425 (108225, 10500) 
    print numpy.max(R) #4176.26290975
    # uses 17.5Gb ram
    return R


def getR2(VVm,VVs,HHm,HHs):
    t0=time.time()
    precomputed_flat = numpy.column_stack((VVs.flatten(), HHs.flatten()))
    measured_flat = numpy.column_stack((VVm.flatten(), HHm.flatten()))
    deltas = precomputed_flat[None,:,:] - measured_flat[:, None, :]
    #print time.time()-t0, deltas.shape # 5.861109972 (108225, 10500, 2)
    R = numpy.einsum('ijk,ijk->ij', deltas, deltas)
    print "R2\t",time.time()-t0,R.shape, #14.5291359425 (108225, 10500)
    print numpy.max(R) #4176.26290975
    # uses 26Gb ram
    return R


def getR3(VVm,VVs,HHm,HHs):
    from numpy.core.umath_tests import inner1d
    t0=time.time()
    precomputed_flat = numpy.column_stack((VVs.flatten(), HHs.flatten()))
    measured_flat = numpy.column_stack((VVm.flatten(), HHm.flatten()))
    deltas = precomputed_flat[None,:,:] - measured_flat[:, None, :]
    #print time.time()-t0, deltas.shape # 5.861109972 (108225, 10500, 2)
    R = inner1d(deltas, deltas)
    print "R3\t",time.time()-t0, R.shape, #12.6972110271 (108225, 10500)
    print numpy.max(R) #4176.26290975
    #Uses 26Gb
    return R


def getR4(VVm,VVs,HHm,HHs):
    from scipy.spatial.distance import cdist
    t0=time.time()
    precomputed_flat = numpy.column_stack((VVs.flatten(), HHs.flatten()))
    measured_flat = numpy.column_stack((VVm.flatten(), HHm.flatten()))
    R=spdist.cdist(precomputed_flat,measured_flat, 'sqeuclidean') #.T
    print "R4\t",time.time()-t0, R.shape, #17.7022118568 (108225, 10500)
    print numpy.max(R) #4176.26290975
    # uses 9 Gb ram
    return R

def getR5(VVm,VVs,HHm,HHs):
    from scipy.spatial.distance import cdist
    t0=time.time()
    precomputed_flat = numpy.column_stack((VVs.flatten(), HHs.flatten()))
    measured_flat = numpy.column_stack((VVm.flatten(), HHm.flatten()))
    R=spdist.cdist(precomputed_flat,measured_flat, 'euclidean') #.T
    print "R5\t",time.time()-t0, R.shape, #15.6070930958 (108225, 10500)
    print numpy.max(R) #64.6240118667
    # uses only 9 Gb ram
    return R

def getR6(VVm,VVs,HHm,HHs):
    from scipy.weave import blitz
    t0=time.time()
    R=VVs.flatten()[numpy.newaxis,:]-VVm.flatten()[:,numpy.newaxis]
    blitz("R=R*R") # R*=R
    R1=HHs.flatten()[numpy.newaxis,:]-HHm.flatten()[:,numpy.newaxis]
    blitz("R1=R1*R1") # R1*=R1
    blitz("R=R+R1") # R+=R1
    del R1
    print "R6\t",time.time()-t0, R.shape, #11.7576191425 (108225, 10500) 
    print numpy.max(R) #4176.26290975
    return R

结果如下：

R1  11.7737319469 (108225, 10500) 4909.66881791
R2  15.1279799938 (108225, 10500) 4909.66881791
R3  12.7408981323 (108225, 10500) 4909.66881791
R4  17.3336868286 (10500, 108225) 4909.66881791
R5  15.7530870438 (10500, 108225) 70.0690289494
R6  11.670968771 (108225, 10500) 4909.66881791

虽然最后一个给出了 sqrt((VVm-VVs)^2+(HHm-HHs)^2)，而其他给出了 (VVm-VVs)^2+(HHm-HHs)^2，这并不重要，因为在我的代码中，我对每个 i 取 R[i,:] 的最小值，而 sqrt 无论如何都不会影响最小值（如果我对距离感兴趣，我只取 sqrt(value) ，而不是对整个数组执行 sqrt，因此实际上没有时间差异。

问题仍然是：为什么第一个解决方案是最好的（第二个和第三个较慢的原因是因为 deltas=... 需要 5.8 秒，（这也是为什么这两种方法需要 26Gb）），以及为什么sqeuclidean 比 euclidean 慢？

sqeuclidean 应该只做 (VVm-VVs)^2+(HHm-HHs)^2，虽然我认为它做了一些不同的事情。有人知道如何找到该方法的源代码（C 或底部的任何内容）吗？我认为它确实 sqrt((VVm-VVs)^2+(HHm-HHs)^2)^2 （我能想到为什么它会比 (VVm-VVs)^2+(HHm-HHs) 慢的唯一原因^2 - 我知道这是一个愚蠢的理由，有人有更合乎逻辑的理由吗？）

由于我对 C 一无所知，我如何将其内联到 scipy.weave 中？该代码是否可以像 python 一样正常编译？或者我需要为此安装特殊的东西吗？

编辑：好的，我用 scipy.weave.blitz 尝试过（R6 方法），这稍微快一些，但我假设比我了解更多 C 的人仍然可以提高这个速度？我只是采取了 a+=b 或 *= 形式的行，并查找它们在 C 中的情况，并将它们放入 blitz 语句中，但我想如果我将带有 flatten 和 newaxis 的语句的行放入C 也是如此，它也应该跑得更快，但我不知道如何做到这一点（了解 C 的人可能会解释一下？）。现在，闪电战和我的第一种方法之间的差异还不足以真正由 C 与 numpy 引起，我猜？

我想其他方法，比如 deltas=... 也可以更快，当我把它放在 C 中时？

每当你有乘法和求和时，尝试使用点积函数之一或np.einsum。由于您是预先分配数组，而不是为水平和垂直坐标使用不同的数组，因此请将它们堆叠在一起：

precomputed_flat = np.column_stack((svf.flatten(), shf.flatten()))
measured_flat = np.column_stack((VVmeasured.flatten(), HHmeasured.flatten()))
deltas = precomputed_flat - measured_flat[:, None, :]

从这里开始，最简单的是：

dist = np.einsum('ijk,ijk->ij', deltas, deltas)

您也可以尝试类似的方法：

from numpy.core.umath_tests import inner1d
dist = inner1d(deltas, deltas)

当然还有SciPy的空间模块cdist http://docs.scipy.org/doc/scipy/reference/generated/scipy.spatial.distance.cdist.html:

from scipy.spatial.distance import cdist
dist = cdist(precomputed_flat, measured_flat, 'euclidean')

EDIT我无法在如此大的数据集上运行测试，但这些时间安排相当有启发性：

len_a, len_b = 10000, 1000

a = np.random.rand(2, len_a)
b =  np.random.rand(2, len_b)
c = np.random.rand(len_a, 2)
d = np.random.rand(len_b, 2)

In [3]: %timeit a[:, None, :] - b[..., None]
10 loops, best of 3: 76.7 ms per loop

In [4]: %timeit c[:, None, :] - d
1 loops, best of 3: 221 ms per loop

对于上面较小的数据集，我可以比你的方法稍微加快速度scipy.spatial.distance.cdist并将其与inner1d，通过在内存中以不同方式排列数据：

precomputed_flat = np.vstack((svf.flatten(), shf.flatten()))
measured_flat = np.vstack((VVmeasured.flatten(), HHmeasured.flatten()))
deltas = precomputed_flat[:, None, :] - measured_flat

import scipy.spatial.distance as spdist
from numpy.core.umath_tests import inner1d

In [13]: %timeit r0 = a[0, None, :] - b[0, :, None]; r1 = a[1, None, :] - b[1, :, None]; r0 *= r0; r1 *= r1; r0 += r1
10 loops, best of 3: 146 ms per loop

In [14]: %timeit deltas = (a[:, None, :] - b[..., None]).T; inner1d(deltas, deltas)
10 loops, best of 3: 145 ms per loop

In [15]: %timeit spdist.cdist(a.T, b.T)
10 loops, best of 3: 124 ms per loop

In [16]: %timeit deltas = a[:, None, :] - b[..., None]; np.einsum('ijk,ijk->jk', deltas, deltas)
10 loops, best of 3: 163 ms per loop

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

numpy 中计算距离的更有效方法？的相关文章

为什么我不能使用“exclude”从 python 轮子中排除“tests”目录？

考虑以下包结构与以下setup py内容 from setuptools import setup find packages setup name dfl client packages find packages exclude te
底图上的子图

我有一张英国地图和 121 个地点每个地点有 3 个值我想绘制 121 个位置中每个位置的三个值的小条形图目前这些值绘制为markersize属性看起来像这样密集恐惧症情节 https i stack imgur com 5fv
为什么在 Windows 中使用 GetConsoleScreenBufferInfoEx 时控制台窗口会缩小？

我正在尝试使用 GetConsoleScreenBufferInfoEx 和 SetConsoleScreenBufferInfoEx 设置 Windows 命令行控制台的背景和前景色我正在 Python 中使用 wintypes 进行此
为什么导入 pdb 时出现此错误？ “模块”对象没有属性“ascii_letters”

尝试调试我的代码我正在导入库pdb import sys from subprocess import check call import pdb functions if name main Code 我收到此错误 File reg p
如何从谷歌云存储桶读取音频文件并在datalab笔记本中使用ipd播放

我想在数据实验室笔记本中播放我从谷歌云存储桶中读取的声音文件这个怎么做 import numpy as np import IPython display as ipd import librosa import soundfile as
用Python中的嵌套for循环替换重复的if语句？

在我编写的下面的代码中 n 4 所以有五个 if 语句所以如果我想将 n 增加到比如说 10 那么就会有很多 if 语句因此我的问题是如何用更优雅的东西替换所有 if 语句 n p 4 5 number of trials prob
如何使用 Pandas 将巨大的 CSV 转换为 SQLite？

我有一个巨大的表大约 60 GB 采用存档的 CSV 文件形式我想将其转换为 SQLite 文件我现在所做的事情如下 import pandas import sqlite3 cnx sqlite3 connect db sqlite
如何修复错误“AttributeError：‘模块’对象在 python3 中没有属性‘客户端’？

以下是我的代码 import http h1 http client HTTPConnection www bing com 我认为没问题但是 python 给了我以下错误 AttributeError 模块对象没有属性客户端我想知
如何从 Python 中指定运行程序的输入文件？

我正在编写一个外部脚本以通过笔记本电脑上的 Python mrjob 模块而不是在 Amazon Elastic Compute Cloud 或任何大型集群上运行 mapreduce 作业我读自mrjob文档 http packag
如何使用 PySpark 有效地将这么多 csv 文件（大约 130,000 个）合并到一个大型数据集中？

我之前发布了这个问题并得到了一些使用 PySpark 的建议如何有效地将这一大数据集合并到一个大数据框中 https stackoverflow com questions 60259271 how can i merge this la
pip 安装软件包两次

不幸的是我无法重现它但我们已经见过几次了 pip 将一个软件包安装两次如果卸载第一个第二个就会可见并且也可以被卸载我的问题如果一个包安装了两次如何用 python 检查背景我想编写一个测试来检查这一点 devOp Updat
如何检查列表是否为空？

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动例如如果通过以下内容 a 我如何检查是否a是空的 if not a print Lis
如何在 Python 中从 HTML 页面中提取 URL [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我必须用Python 编写一个网络爬
从 IMDbPy 结果中的片目中获取电影 ID

我正在尝试创建一个数据集允许我根据 Python IMDb API 中的演员 ID 和电影 ID 加入演员和电影现在我正在尝试从演员的电影作品中提取电影 ID 列表但无法做到例如我知道 Rodney Dangerfield 在
使用Beam IO ReadFromPubSub模块时，可以在Python中提取带有属性的消息吗？尚不清楚是否支持

尝试将具有存储在 PubSub 中的属性的消息拉取到 Beam 管道中我想知道是否添加了对 Python 的支持这就是我无法阅读它们的原因我看到它存在于Java中 pipeline options PipelineOptions pi
Spyder 如何在同一线程的后台运行 asyncio 事件循环（或者确实如此？）

我已经研究 asyncio 模块功能几天了因为我想将它用于我的应用程序的 IO 绑定部分并且我认为我现在对它的工作原理有一个合理的理解或者在至少我认为我已经理解了以下内容任一时刻任一线程中只能运行一个异步事件循环一旦一切都设置
SQLAlchemy：避免声明式样式类定义中的重复

我正在使用 SQLAlchemy 并且我的对象模型中的许多类具有相同的两个属性 id 和整数和主键以及名称字符串我试图避免在每个类中声明它们如下所示 class C1 declarative base id Column Inte
在游戏中实现功能

我在完成这部分作业时遇到了麻烦我必须宣布游戏的获胜者然后输入到函数中输入所有 if 语句后我必须创建一个函数def playGame 这必须包括 showRules user getUserChoice computer getCo
在Python 3.2中，我可以使用http.client打开并读取HTTPS网页，但urllib.request无法打开同一页面

我想打开并阅读https yande re https yande re with urllib request 但我收到 SSL 错误我可以使用以下方式打开并阅读页面http client用这个代码 import http client
从数据集的给定日期范围中提取属于一天的数据

我有一个数据集日期范围为 2018 年 1 月 12 日到 8 月 3 日其中包含一些值维数为my df数据框是 my df shape 9752 2 每行包含半小时频率第一行开始于2018 01 12 my df iloc 0 D

随机推荐

在 Android 中创建 CDMA (3gpp2) PDU

我上周问了一个类似的问题甚至在意识到问题是给出的答案是针对一个GSM PDU 3gpp https stackoverflow com a 12338541 1443717它在模拟器 android 2 2 中完美运行我接受了答案并授予
无法确定外键的复合外键排序

Person是包含所有用户的用户模型变更模型包括EngineerId和ManagerId 两者都是Person ID 为什么我会收到此错误无法确定类型 ProjectName Models Change 上外键的复合外键排序在复合外键
Tomcat 中的 crossContext 属性有什么作用？它是否启用会话共享？

我能找到的一切Tomcat 5 5 文档 http tomcat apache org tomcat 5 5 doc config context html is 如果您希望在此应用程序中调用 ServletContext getConte
将 Google 表单发布到 MySQL 数据库？

我浏览了网络谷歌等我无法破译是否可以将谷歌表单数据发布到谷歌文档and到我网站其余部分运行的数据库这样做的原因是我可以允许拥有 Google 帐户的人完成大型表格或调查我可以快速轻松地构建这些表格或调查感谢您的任何启发性回复是
如何使 JavaFX MediaView 拉伸媒体以填充父容器？

我试图使视频的尺寸自动拉伸并填充 MediaView 并保持视频的原始宽高比基本上我希望我的 MediaPlayer 在调整大小等时适合父容器就像几乎所有视频播放器一样如果有人能够阐明如何实现这一目标我们将不胜感激谢谢下面是拉
如何在不启动应用程序的情况下检查 AppleScript 是否正在运行 - 通过 osascript 实用程序

考虑以下 AppleScript on is running appName tell application System Events to name of processes contains appName end is runni
安全的跨平台协程

我遇到的所有协程实现都使用汇编或检查的内容jmp buf 问题在于它本质上不跨平台我认为以下实现不会导致未定义的行为或依赖于实现细节但我从来没有遇到过这样写的协程在线程中使用长跳转是否存在一些固有的缺陷这段代码中是否存在一些隐藏的问
jQuery focus() 有时在 IE8 中不起作用

我正在使用 jQuery 开发 web 应用程序我有添加新行 3 个输入字段的功能创建这些 DOM 元素后我想要聚焦输入字段之一我正在通过在必要的输入字段上调用 jQuery focus 函数来做到这一点问题是调用 focus 在
Java中如何实现多线程

我必须对一个以 1000 个批次运行代码的方法进行多线程处理我需要将这些批次分配给不同的线程目前我已经生成了 3 个线程但所有 3 个线程都选择了第一批 1000 个线程我希望其他批次不应该选择同一批次而是选择其他批次请大家帮忙
Android Studio 意外锁定文件协议

我正在尝试将 android studio 项目导入到新机器中导入进行得很好并且项目的目录显示正确但是当我尝试构建或清理项目时 android studio 会引发以下错误 Gradle ngoma project refresh
在 Chrome 扩展程序中读取和修改 HTTP GET 请求

我想在 Chrome 扩展程序中读取和修改添加 HTTP 标头我正在使用 chrome webRequest API 来实现同样的目的但我仍然无法阅读它这是我的代码 chrome webRequest onBeforeSendHea
为什么 QList::at() 不检查索引是否存在并返回只读值？

这个问题更多的是一种询问而不是实际寻求问题的解决方案 QList at 不仅不检查索引是否越界而且还返回const因此它只能用于read only设想 const T QList at int i const 返回列表中索引位置 i 处
Android CalendarView 4.1 上的文本尺寸太小

Jelly Bean 4 1 似乎存在一个错误导致日期的文本大小CalendarView在高分辨率设备上小得不成比例似乎它已在 4 2 中修复但是有没有任何解决方法可以使其在 4 1 设备上看起来合理我尝试过这样的事情
如何从多个数组中获取所有组合？

假设我有这 3 个数组 array1 array 1 2 array2 array 4 5 array3 array 7 8 我需要这个输出 1 4 7 1 4 8 1 5 7 1 5 8 2 4 7 2 4 8 2 5 7 2 5 8 我
在 sublime text 3 中将 .tmLanguage 放在哪里？

我在将 Ruby 语法突出显示与 RegExp 结合使用时遇到问题有人建议我使用一些附加代码更新 Ruby tmLanguage 文件问题是我在计算机上找不到该文件在 sublime text 3 Packages 中我只看到 s
在将字符串转换为一组对象的情况下，最好的 Spring 转换器策略是什么？

我的观点之一是以下简化的形式
在 Flask 中改变 request.base_url

我在负载平衡后面有一个终止 SSL 的 Flask 应用程序我有代码可以检测何时使用 SSL 并改变请求对象 app before request def before request x forwarded proto reques
Jackson 自定义过滤器，具有完整的 POJO 数据绑定

这个问题延伸这个问题 https stackoverflow com questions 38840659 conditional field requirement based on another field value in jack
poco c++ 静态链接问题与未定义的符号引用

我正在尝试链接到 POCO C 库的静态版本如下所示 g BCCMain o L POCO LIBS Wl Bstatic POCO LIBS libPocoFoundation a POCO LIBS libPocoUtil a POC
numpy 中计算距离的更有效方法？

我有一个关于如何尽可能快地计算 numpy 距离的问题 def getR1 VVm VVs HHm HHs t0 time time R VVs flatten numpy newaxis VVm flatten numpy newaxis

numpy 中计算距离的更有效方法？

numpy 中计算距离的更有效方法？ 的相关文章

随机推荐

热门标签

numpy 中计算距离的更有效方法？的相关文章