内存错误 Numpy/Python 欧几里得距离

2023-12-15

我正在尝试使用 numpy 和 python 运行 K 均值聚类算法，但如果我使用较大的 K 值（任何大于 10 的值似乎都会导致错误），就会不断遇到内存错误。我有两个大小为 [42000,784] （数据集）和 [K,784] （质心）的 numpy 数组。计算每个质心与每个数据点之间的欧氏距离时会出现内存错误。这是我一直在使用的功能：

def dist(a,b):
    a = a[np.newaxis,:,:]
    b = b[:,np.newaxis,:]
    dist = np.linalg.norm((a-b), axis=2) 
    return dist

这是内存泄漏还是我确实没有足够的内存（我有 8GB）？我怎样才能解决这个问题？

scipy具有用于距离计算的内置函数，与自制的实现相比，速度快如闪电。

所以，第一个想法是更换你的整个distance函数由以下表达式表示：

from numpy.random import rand
from scipy.spatial import distance

# sample data
a = randn(42000, 784
b = randn(256, 784)

# distance computation
dist = distance.cdist(a, b, metric='euclidean')    # about 8.02 s on 
                                                   # my 8 GB RAM machine

注意dist在这个例子中是根据你的例子进行转置的。如果你想要你的例子的形状就这样做dist = distance.cdist(a, b).T.

通过省略平方根运算还可以进一步加快计算速度。您可以通过以下方式完成此操作dist = distance.cdist(a, b, metric='sqeuclidean').

整个方法并没有大大减少内存消耗，但只占用内存几秒钟。

第二个想法是根本不使用自制的实现，而是使用一些可靠的第三方软件包，例如众所周知的Scikit Learn:

from sklear.cluster import KMeans
a = randn(4200, 200)

km = KMeans(n_clusters=256)
km.fit(a)                    # about 10 s

此实现的几个优点之一是，它会自动决定如何计算距离，这样就不会破坏您的记忆。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

NumPy

memoryleaks

kmeans

RAM

内存错误 Numpy/Python 欧几里得距离的相关文章

如何在刻度标签和轴之间添加空间

我已成功增加刻度标签的字体但现在它们距离轴太近了我想在刻度标签和轴之间添加一点呼吸空间如果您不想全局更改间距通过编辑 rcParams 并且想要更简洁的方法请尝试以下操作 ax tick params axis both whic
InterfaceError：连接已关闭（使用 django + celery + Scrapy）

当我在 Celery 任务中使用 Scrapy 解析函数有时可能需要 10 分钟时我得到了这个信息我用姜戈 1 6 5 django celery 3 1 16 芹菜 3 1 16 psycopg2 2 5 5 我也使用了psyc
使用 openCV 对图像中的子图像进行通用检测

免责声明我是计算机视觉菜鸟我看过很多关于如何在较大图像中查找特定子图像的堆栈溢出帖子我的用例有点不同因为我不希望它是具体的而且我不确定如何做到这一点如果可能的话但我感觉应该如此我有大量图像数据集有时其中一些图像是数据集的
如何生成给定范围内的回文数列表？

假设范围是 1 X 120 这是我尝试过的 gt gt gt def isPalindrome s check if a number is a Palindrome s str s return s s 1 gt gt gt def ge
如何收集列表、字典等中重复计算的结果（或制作修改每个元素的列表的副本）？

There are a great many existing Q A on Stack Overflow on this general theme but they are all either poor quality typical
更改自动插入 tkinter 小部件的文本颜色

我有一个文本框小部件其中插入了三条消息一条是开始消息一条是结束消息一条是在单位被摧毁时发出警报的消息我希望开始和结束消息是黑色的但被毁坏的消息参见我在代码中评论的位置插入小部件时颜色为红色我不太确定如何去做这件事我看
如何使用包含代码的“asyncio.sleep()”进行单元测试？

我在编写 asyncio sleep 包含的单元测试时遇到问题我要等待实际的睡眠时间吗 I used freezegun到嘲笑时间当我尝试使用普通可调用对象运行测试时这个库非常有用但我找不到运行包含 asyncio sleep 的测
如何使用 Scrapy 从网站获取所有纯文本？

我希望在 HTML 呈现后可以从网站上看到所有文本我正在使用 Scrapy 框架使用 Python 工作和xpath body text 我能够获取它但是带有 HTML 标签而且我只想要文本有什么解决办法吗最简单的选择是ext
为 pandas 数据透视表中的每个值列定义 aggfunc

试图生成具有多个值列的数据透视表我知道我可以使用 aggfunc 按照我想要的方式聚合值但是如果我不想对两列求和或求平均值而是想要一列的总和同时求另一列的平均值该怎么办那么使用 pandas 可以做到这一点吗 df pd D
keras加载模型错误尝试将包含17层的权重文件加载到0层的模型中

我目前正在使用 keras 开发 vgg16 模型我用我的一些图层微调 vgg 模型拟合我的模型训练后我保存我的模型model save name h5 可以毫无问题地保存但是当我尝试使用以下命令重新加载模型时load mod
NameError：名称“urllib”未定义”

CODE import networkx as net from urllib request import urlopen def read lj friends g name fetch the friend list from Liv
feedparser 在脚本运行期间失败，但无法在交互式 python 控制台中重现

当我运行 eclipse 或在 iPython 中运行脚本时它失败了 ascii codec can t decode byte 0xe2 in position 32 ordinal not in range 128 我不知道为什么但
Python：尝试检查有效的电话号码

我正在尝试编写一个接受以下格式的电话号码的程序XXX XXX XXXX并将条目中的任何字母翻译为其相应的数字现在我有了这个如果启动不正确它将允许您重新输入正确的数字然后它会翻译输入的原始数字我该如何解决 def main phon
如何改变Python中特定打印字母的颜色？

我正在尝试做一个简短的测验并且想将错误答案显示为红色欢迎来到我的测验您想开始吗是的祝你好运法国的首都是哪里法国随机答案不正确的答案我正在尝试将其显示为红色我的代码是 print Welcome to my Quiz be
从 pygame 获取 numpy 数组

我想通过 python 访问我的网络摄像头不幸的是由于网络摄像头的原因 openCV 无法工作 Pygame camera 使用以下代码就像魅力一样 from pygame import camera display camera in
设置 torch.gather(...) 调用的结果

我有一个形状为 n x m 的 2D pytorch 张量我想使用索引列表来索引第二个维度可以使用 torch gather 完成然后然后还设置新值到索引的结果 Example data torch tensor 0 1 2 3 4
用于运行可执行文件的python多线程进程

我正在尝试将一个在 Windows 上运行可执行文件并管理文本输出文件的 python 脚本升级到使用多线程进程的版本以便我可以利用多个核心我有四个独立版本的可执行文件每个线程都知道要访问它们这部分工作正常我遇到问题的地方是当它们
从 Python 中的类元信息对 __init__ 函数进行类型提示

我想做的是复制什么SQLAlchemy确实以其DeclarativeMeta班级有了这段代码 from sqlalchemy import Column Integer String from sqlalchemy ext declar
如何使用google colab在jupyter笔记本中显示GIF？

我正在使用 google colab 想嵌入一个 gif 有谁知道如何做到这一点我正在使用下面的代码它并没有在笔记本中为 gif 制作动画我希望笔记本是交互式的这样人们就可以看到代码的动画效果而无需运行它我发现很多方法在 Goo
循环标记时出现“ValueError：无法识别的标记样式 -d”

我正在尝试编码pyplot允许不同标记样式的绘图这些图是循环生成的标记是从列表中选取的为了演示目的我还提供了一个颜色列表版本是Python 2 7 9 IPython 3 0 0 matplotlib 1 4 3 这是一个简单的代

随机推荐

如何从圆角矩形的顶部中心开始描边

我想用 SVG 制作一个按钮并复制 YouTube 的自动播放圈我一直在尝试让笔划在顶部中心开始和结束但它会在左上角开始最好因为当我开始更改笔划 dasharry 和笔划 dashoffset 周围的数字时它开始在开始或结束我知道
ListFragment OnListItemClick 未被调用

我有一个扩展 ListFragment 的类它重写了 OnListItemClick 方法我也在另一个 ListFragment 中以相同的方式执行此操作并且该方法被调用我想知道为什么当我单击列表项时该方法没有被调用这是代码 pa
IE 需要 2 个文本框来提交一个按钮？

我遇到了这个奇怪的问题我不确定是 ASP NET 还是 IE 7 造成的这个想法是这样的当我的表单上只有一个文本框和一个提交按钮时在文本框中按 ENTER 键将仅发布文本框的值该按钮不会被提交即使在服务器端也不会触发单击当
Excel VBA 应用程序.OnTime。我认为使用这个……想法是个坏主意？

我支持的许多用户要求事情自动发生当然更自动但这是另一点一个希望事件每 120 秒发生一次请参阅我的其他问题另一个希望在每个工作日下午 5 点发生一件事这必须在 Excel 工作表上因此 VBA 作为插件等将是不行的因为它需要
HTML 画布矩形内的阴影效果

背景我正在使用浏览器 HTML5 canvas 元素我有代码我在网上找到允许我在画布上绘制一个矩形 Question 我想在鼠标移动事件触发时应用如图所示的阴影效果如何才能实现这一目标当前方法我当前的方法是在触发 mous
ASP.NET 会话和删除文件夹

我有一个网络应用程序管理员可以在其中创建新闻 pdf 文档和他的 cms 面板中的其他内容问题是当管理员删除新文件或其他文件时应用程序会删除与该新文件相关的所有文件我指的是图像 pdf 和其他文档主要问题是这些文件存储在新闻
如何从 JSF 数据表内的 selectOneMenu 获取值？

我有一个包含一堆行的 JSF 数据表每行内部都有一个 selectOneMenu 如下所示
跨 PHP、MySQL 等管理日期的最佳方法是什么？

我的服务器在达拉斯我在纽约市 PHP 和 MySQL 都有用于设置时区的配置变量我如何让他们一起工作我应该在 MySQL 中存储哪些日期如何让 PHP 根据用户的偏好来处理日期更改请记住我认为我从未让 PHP 显式设置过日期它
从 ASMX Web 服务返回 JSON，无需 XML 包装器？

我需要从 C Web 服务获取 Json 数据我知道有几个基于此的问题相信我我已经阅读了很多但只是让我更加困惑这就是我所做的在我的网络服务中我包括 System Web Script Services ScriptServic
是否可以为内嵌文本创建框阴影效果？

我想创建这样的效果有没有办法通过 CSS JS 来做到这一点非常感谢我是网页设计的新手在过去的几个小时里我一直在努力解决这个问题下面是一种仅使用 CSS 即可实现文本多行填充突出显示行为的方法这是基于其他地方找到的 box
python 线程 - 迭代 n 个任务时始终有 x 个活动线程

我基本上想做的是 import threading import Queue def test thread elem q q put elem 2 a 1 2 3 4 5 6 7 8 q Queue Queue results for x
我可以在 __new__ 或 __init__ 期间创建类属性吗？

我想做这样的事情但到目前为止我还没有取得多大成功我想让每个 attr 成为一个仅在访问时计算 lazy eval 的属性 class Base object def init self for attr in self myattrs
删除Python字典中的重复值

我在 Stack Overflow 上发现了这个问题从字典中删除重复项另一个问题中的人也有我同样的问题我尝试了他们给他的解决方案但没有一个有效你能帮助我吗这是我的清单然后这是我的代码 def printed filename da
获取 WordPress 中激活插件的列表并从管理菜单中删除插件链接

是否可以在 WordPress 中获取激活插件列表并将其从管理菜单栏中删除我想从管理栏中删除所有激活插件链接找出页面并替换your plugin page 这将列出所有激活的插件 apl get option active plugin
更改子图上的刻度数

如果我有一个子图如何更改其刻度数我不知道数据的最大值和最小值我的代码是 azal rif add subplot 111 azal plot eels 10 9 averspe label data azal plot eels 10
C#：创建单个机器人服务以支持多个机器人应用程序

该代码位于该网站上https www microsoft com reallifecode 2017 01 10 creating a single bot service to support multiple bot applicati
没有为 Rack::Session::Cookie 警告提供秘密选项？

我在 Fedora 17 下运行 Rails 3 2 3 Ruby 1 9 当我运行时我收到此警告rails s 我该如何解决安全警告没有向 Rack Session Cookie 提供秘密选项这构成了安全威胁强烈建议您提供一个
C++ 类中的成员是否保证是连续的？

C 中的类成员是否保证是连续的我尝试使用几乎所有流行的 C 编译器运行以下代码并且all其中的结果是 4 它是变量 y 的相对地址这是巧合还是语言规范保证如此难道编译器不会让成员 x 和 y 与类基本地址连续彼此连续吗请注意t
HTML5 - 拖放 div 和内部图像

我有这种类型的元素 div style margin 20px background red height 400px width 400px a href target blank img style margin 40px src ht
内存错误 Numpy/Python 欧几里得距离

我正在尝试使用 numpy 和 python 运行 K 均值聚类算法但如果我使用较大的 K 值任何大于 10 的值似乎都会导致错误就会不断遇到内存错误我有两个大小为 42000 784 数据集和 K 784 质心的 numpy

内存错误 Numpy/Python 欧几里得距离

内存错误 Numpy/Python 欧几里得距离 的相关文章

随机推荐

热门标签

内存错误 Numpy/Python 欧几里得距离的相关文章