增加 n_jobs 对 GridSearchCV 没有影响

2023-11-21

我设置了简单的实验来检查运行 sklearn 时多核 CPU 的重要性GridSearchCV with KNeighborsClassifier。我得到的结果让我感到惊讶，我想知道我是否误解了多核的好处，或者也许我没有做得正确。

2-8 个作业之间的完成时间没有差异。怎么会？我注意到 CPU 性能选项卡上的差异。第一个单元运行时，CPU 使用率约为 13%，最后一个单元的 CPU 使用率逐渐增加到 100%。我原以为它会更快完成。也许不是线性更快，即 8 个作业会比 4 个作业快 2 倍，但要快一点。

我是这样设置的：

我使用的是jupyter-notebook，cell指的是jupyter-notebook cell。

我已经加载了 MNIST 并使用0.05测试尺寸为3000a 中的数字X_play.

from sklearn.datasets import fetch_mldata
from sklearn.model_selection import train_test_split

mnist = fetch_mldata('MNIST original')

X, y = mnist["data"], mnist['target']

X_train, X_test, y_train, y_test = X[:60000], X[60000:], y[:60000], y[60000:]
_, X_play, _, y_play = train_test_split(X_train, y_train, test_size=0.05, random_state=42, stratify=y_train, shuffle=True)

在下一个单元格中我进行了设置KNN and a GridSearchCV

from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import GridSearchCV

knn_clf = KNeighborsClassifier()
param_grid = [{'weights': ["uniform", "distance"], 'n_neighbors': [3, 4, 5]}]

然后我为 8 个 n_jobs 值创建了 8 个单元格。我的CPU是i7-4770，4核8线程。

grid_search = GridSearchCV(knn_clf, param_grid, cv=3, verbose=3, n_jobs=N_JOB_1_TO_8)
grid_search.fit(X_play, y_play)

Results

Parallel(n_jobs=1)]: Done  18 out of  18 | elapsed:  2.0min finished
Parallel(n_jobs=2)]: Done  18 out of  18 | elapsed:  1.4min finished
Parallel(n_jobs=3)]: Done  18 out of  18 | elapsed:  1.3min finished
Parallel(n_jobs=4)]: Done  18 out of  18 | elapsed:  1.3min finished
Parallel(n_jobs=5)]: Done  18 out of  18 | elapsed:  1.4min finished
Parallel(n_jobs=6)]: Done  18 out of  18 | elapsed:  1.4min finished
Parallel(n_jobs=7)]: Done  18 out of  18 | elapsed:  1.4min finished
Parallel(n_jobs=8)]: Done  18 out of  18 | elapsed:  1.4min finished

第二次测试

随机森林分类器的使用要好得多。测试尺寸为0.5, 30000 images.

from sklearn.ensemble import RandomForestClassifier

rf_clf = RandomForestClassifier()
param_grid = [{'n_estimators': [20, 30, 40, 50, 60], 'max_features': [100, 200, 300, 400, 500], 'criterion': ['gini', 'entropy']}]

Parallel(n_jobs=1)]: Done 150 out of 150 | elapsed: 110.9min finished
Parallel(n_jobs=2)]: Done 150 out of 150 | elapsed: 56.8min finished
Parallel(n_jobs=3)]: Done 150 out of 150 | elapsed: 39.3min finished
Parallel(n_jobs=4)]: Done 150 out of 150 | elapsed: 35.3min finished
Parallel(n_jobs=5)]: Done 150 out of 150 | elapsed: 36.0min finished
Parallel(n_jobs=6)]: Done 150 out of 150 | elapsed: 34.4min finished
Parallel(n_jobs=7)]: Done 150 out of 150 | elapsed: 32.1min finished
Parallel(n_jobs=8)]: Done 150 out of 150 | elapsed: 30.1min finished

以下是一些原因might成为此行为的原因

With increasing no. of threads, there is an apparent overhead incurred for intializing and releasing each thread. I ran your code on my i7 7700HQ, I saw the following behaviour with each inceasing n_job
- when n_job=1 and n_job=2每个线程的时间（GridSearchCV 评估每个模型以完全训练模型并测试模型的时间）为 2.9 秒（总时间约为 2 分钟）
- when n_job=3，时间为3.4秒（总时间1.4分钟）
- when n_job=4，时间为3.8秒（总时间58秒）
- when n_job=5，时间为4.2秒（总时间51秒）
- when n_job=6，时间为 4.2 秒（总时间约 49 秒）
- when n_job=7，时间为 4.2 秒（总时间约 49 秒）
- when n_job=8，时间为 4.2 秒（总时间约 49 秒）
现在如您所见，每个线程的时间增加了，但总体时间似乎减少了（尽管超出了n_job=4 the different was not exactly linear) and remained constained withn_jobs>=6` 这是因为初始化和释放线程会产生成本。看这个 github 问题 and 这个问题.
此外，可能还存在其他瓶颈，例如数据太大而无法同时广播到所有线程、线程对 RAM（或其他资源等）的抢占、数据如何推送到每个线程等。
I suggest you to read about Ahmdal's Law which states that there is a theoretical bound on the speedup that can be achieved through parallelization which is given by the formula Image Source : Ahmdal's Law : Wikipedia
最后，这可能是由于数据大小和您用于训练的模型的复杂性所致。

Here is 一篇博文解释有关多线程的相同问题。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

增加 n_jobs 对 GridSearchCV 没有影响的相关文章

如何在 Matplotlib 饼图周围绘制箭头以将每个标签指向圆圈中各自的部分？

我一直在用 Matplotlib 绘制一些图表我有一个饼图想要在图表周围绘制箭头使每个标签都指向图表我有一个例子这是我当前的代码 import matplotlib pyplot as plt plt rcParams font
matplotlib 图中点的标签

所以这是一个关于已发布的解决方案的问题我试图在我拥有的 matplotlib 散点图中的点上放置一些数据标签我试图在这里模仿解决方案是否有与 MATLAB 的 datacursormode 等效的 matplotlib https s
Django Rest Framework 是否有第三方应用程序来自动生成 swagger.yaml 文件？

我有大量的 API 端点编写在django rest framework并且不断增加和更新如何创建和维护最新的 API 文档我当前的版本是 Create swagger yaml文件并以某种方式在每次端点更改时自动生成然后使用此文件作
如何从Python中的函数返回多个值？ [复制]

这个问题在这里已经有答案了如何从Python中的函数返回多个变量您可以用逗号分隔要返回的值 def get name you code return first name last name 逗号表示它是一个元组因此您可以用括号将值括
python multiprocessing 设置生成进程等待

是否可以生成一些进程并将生成进程设置为等待生成的进程完成下面是我用过的一个例子 import multiprocessing import time import sys def daemon p multiprocessing curr
InvalidOperationException - 对象当前正在其他地方使用 - 红十字

我有一个 C 桌面应用程序其中我连续创建的一个线程从源实际上是一台数码相机获取图像并将其放在 GUI 中的面板 panel Image img 上这必须是另一个线程如它是控件的代码隐藏该应用程序可以工作但在某些机器上我会在随
Pycharm 在 os.path 连接上出现“未解析的引用”

将pycharm升级到2018 1 并将python升级到3 6 5后 pycharm报告未解析的引用 join 最新版本的 pycharm 不会显示以下行的任何警告 from os path import join expanduser
打印包含字符串和其他 2 个变量的变量

var a 8 var b 3 var c hello my name is var a and var b bye print var c 当我运行程序时 var c 会像这样打印出来 hello my name is 8 and 3 b
从 Powershell 脚本安装 Python

当以管理员身份从 PowerShell 命令行运行以下命令时可以在 Windows 11 上成功安装 Python c temp python 3 11 4 amd64 exe quiet InstallAllUsers 0 Instal
未知错误：Chrome 无法启动：异常退出

当我使用 chromedriver 对 Selenium 运行测试时出现此错误 selenium common exceptions WebDriverException Message unknown error Chrome fail
Django REST Framework - CurrentUserDefault 使用

我正在尝试使用CurrentUserDefault一个序列化器的类 user serializers HiddenField default serializers CurrentUserDefault 文档说为了使用它请求必须作为
Android 中的处理程序与异步调用

目前我正在使用处理程序来调用 Web 服务方法以使其在后台运行问题是它需要更多的时间来给出响应在性能方面似乎更昂贵现在我计划使用异步调用哪一个是最好的 Android 中的处理程序和异步调用有什么区别请帮我想出一个最好的解决方案
带有 LSTM 的 GridSearchCV/RandomizedSearchCV

我一直在尝试通过 RandomizedSearchCV 调整 LSTM 的超参数我的代码如下 X train X train reshape X train shape 0 1 X train shape 1 X test X test
如何使用 AWS Lambda Python 读取 AWS S3 存储的 Word 文档（.doc 和 .docx）文件内容？

我的场景是我尝试使用 python 实现从 Aws Lambda 读取 AWS 存储的 S3 word 文档 doc 和 docx 文件内容下面的代码是我使用的我的问题是我可以获取文件名但无法读取内容 def lambda hand
Python：Goslate 翻译请求返回“503：服务不可用”[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我们不允许提出寻求书籍工具软件库等推荐的问题您可以编辑问题以便用事实和引文来回答这个问题似乎不是关于主要由程序员使用的特定编程问
如果 PyPy 快 6.3 倍，为什么我不应该使用 PyPy 而不是 CPython？

我已经听到很多关于PyPy http en wikipedia org wiki PyPy项目他们声称它比现有技术快 6 3 倍CPython http en wikipedia org wiki CPython口译员开启他们的网站 ht
等待子进程使用 os.system

我用了很多os system在 for 循环内调用创建后台进程如何等待所有后台进程结束 os wait告诉我没有子进程 ps 我使用的是Solaris 这是我的代码 usr bin python import subprocess imp
根据 Pandas 中的列表选择数据框行的子集

我有一个数据框df1并列出x In 22 import pandas as pd In 23 df1 pd DataFrame C range 5 B range 10 20 2 A list abcde In 24 df1 Out 24
python 对浮点数进行不正确的舍入

gt gt gt a 0 3135 gt gt gt print 3f a 0 314 gt gt gt a 0 3125 gt gt gt print 3f a 0 312 gt gt gt 我期待 0 313 而不是 0 312 有没有
JSON：TypeError：Decimal（'34.3'）不是JSON可序列化的[重复]

这个问题在这里已经有答案了我正在运行一个 SQL 查询它返回一个小数列表当我尝试将其转换为 JSON 时出现类型错误查询 res db execute SELECT CAST SUM r SalesVolume 1000 0 AS

随机推荐

h1 标签类别（备用）

我知道 h1 标签对于 SEO 很重要所以我所有的标题都是 H1 太棒了现在我需要在某些页面上有一个稍微不同的标题作为文本的第一行通常我只是将 h1 复制为 h2 并交替问题是否可以在标题标签中添加一个类我尝试过但没有成功
是否可以在handlebars.js模板中使用JavaScript

描述说明了一切如何将 JavaScript 脚本放入车把模板中我想为我的网站制作一个动态 Paypal 按钮
PyQt5：对象没有属性“连接”

我目前正在关注thisPyQt 中线程的教程代码来自here 由于它是用 PyQt4 和 Python2 编写的因此我调整了代码以使其能够与 PyQt5 和 Python3 一起使用这是 gui 文件 newdesign py cod
优化 ORDER BY

我正在尝试优化这个排序查询posts by reputation字段第一个然后id场第二如果没有第一个字段查询则需要约 0 250 秒但如果有第一个字段查询则需要约 2 500 秒意味着慢了 10 倍太糟糕了有什么建议吗
我可以得到Python中“print”语句的输出吗？

pythonw exe 没有控制台所以我看不到 print 的输出但我的程序在 python exe 中正常在 pythonw exe 中失败我只想查看 python 解释器的日志和我的 print 语句打印的日志这可行吗您可以
如何将 Nginx IP 附加到 Kubernetes Nginx Ingress Controller 中的 X-Forwarded-For

我想知道如何将 Nginx IP 附加到 X Forwarded For 我在 Ingress 注释中添加了片段 apiVersion networking k8s io v1beta1 kind Ingress metadata nam
适用于字节数组的哈希码方法？

数组的最佳哈希方法是什么byte 这些数组是序列化的类对象包含通过 TCP IP 在应用程序之间传递的 jpeg 图像数组大小约为200k 任何内置的散列函数都可以根据您对碰撞的关心程度您可以选择以下选项从最多碰撞到最少碰撞 MD
托管在不同域上的 JavaScript 可以读取/修改另一个域的 DOM 吗？

我有一个关于托管在域例如 CDN 的域例如 example com 上但从不同域例如 example net 下的网站加载的 JavaScript 的潜在安全问题限制的问题现在想象一下加载的 JavaScript 将仅读取修改
存储过程给出与 tsql 不同的结果集，仅在某些服务器上

这是我昨天提出的问题的后续您是否曾经遇到过 SQL Server 2008 返回与 SQL Server 2000 不同的结果集的情况我最初认为存储过程在 sql2000 和 sql2008 上给出了不同的结果但我已经做了相当多的缩小
CLLocation距离转换

我在 CLLocationDistance 类型的变量中有距离我需要将其转换为整数变量我该怎么做我有用 CLLocationDistance kilometers int distance kilometers intValue 但它
自动终止 AWS EC2 实例？

有没有办法让 Amazon Web Services EC2 实例自行终止亚马逊是否有任何东西允许实例在运行超过一个小时后自行终止 Hara Kiri 我可以更改正在运行的实例上的脚本来自行执行此操作但这可能会失败而且我不想编辑图像
GridView 分页 - 第一个、最后一个、下一个、上一个

是否可以添加 GridView 分页的第一个最后一个下一个上一个选项我似乎无法弄清楚我能得到的只是数字 gt gt 代表最后一个设置 PagerSettings 部分的 PageText 属性的值
不可分配给编辑器中“Expected>”类型的参数

我的测试是从命令行通过的但是我编辑了typescript来源使用Atom 当我在编辑器中打开其中一个测试文件时我在这一行看到一个错误 expect pageObject name getText toEqual Some name 这是
Sigar 不满意链接错误

我是西格尔的新手我想运行一个简单的测试来了解如何监控我的系统 I added sigar 1 6 4 and log4j作为外部库但是当我运行它时我遇到以下错误 Exception in thread main java lang U
可停靠的Windows。浮动窗口和主窗口菜单集成

在 Visual Studio 2010 中可停靠 Windows 似乎在任何情况下都能按预期工作如果浮动文档处于活动状态并且选择了某些菜单例如编辑 gt 粘贴则浮动文档仍然具有焦点并且将针对该浮动窗口执行该命令另
我如何循环遍历 OracleDataReader 的所有列

我有以下代码我想循环遍历此查询结果中的所有字段并填充名为 field 的字典给定一个数据读取器这可能吗 OracleCommand command connection CreateCommand string sql Select
如何将 Nifti 文件转换为 Numpy 数组？

我的 Nifti 文件 ii gz 中有 3D 数组我想将其保存为 3D numpy 数组我使用 Nibabel 将 Numpy 转换为 Nifti1 我可以反其道而行之吗 From nipy import numpy as np im
为什么 StyleCop 建议在方法或属性调用前加上“this”前缀？

我一直在尝试遵循 StyleCop 的项目指南看看最终生成的代码是否更好大多数规则都是合理的或者是关于编码标准的意见问题但有一条规则令我困惑因为我没有看到其他人推荐它而且因为我没有看到它有明显的好处 SA1101 对方法或属性
尽管文件 URL 加载，AngularJS 指令 templateUrl 返回 400

我在 MVC 5 布局页面中有一个基本指令其中包含一个搜索指令我的问题是 templateUrl 无法加载 400 错误如果我直接在浏览器中输入 URL 我可以毫无困难或错误地加载 html 页面我无法找出加载页面的 AJAX 调用
增加 n_jobs 对 GridSearchCV 没有影响

我设置了简单的实验来检查运行 sklearn 时多核 CPU 的重要性GridSearchCV with KNeighborsClassifier 我得到的结果让我感到惊讶我想知道我是否误解了多核的好处或者也许我没有做得正确 2 8 个

增加 n_jobs 对 GridSearchCV 没有影响

增加 n_jobs 对 GridSearchCV 没有影响 的相关文章

随机推荐

热门标签

增加 n_jobs 对 GridSearchCV 没有影响的相关文章