Scikit Learn GridSearchCV 无需交叉验证（无监督学习）

2024-05-27

是否可以在没有交叉验证的情况下使用 GridSearchCV？我正在尝试通过网格搜索优化 KMeans 聚类中的聚类数量，因此我不需要或想要交叉验证。

The 文档 http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html也让我感到困惑，因为在 fit() 方法下，它有一个无监督学习的选项（说使用 None 进行无监督学习）。但如果你想做无监督学习，你需要在没有交叉验证的情况下进行，而且似乎没有选择摆脱交叉验证。

经过多次搜索，我找到了这个线程 https://github.com/scikit-learn/scikit-learn/issues/2048。如果您使用以下命令，您似乎可以摆脱 GridSearchCV 中的交叉验证：

cv=[(slice(None), slice(None))]

我已经在没有交叉验证的情况下针对我自己的网格搜索编码版本进行了测试，并且从这两种方法中得到了相同的结果。我将此答案发布到我自己的问题，以防其他人遇到同样的问题。

编辑：为了回答 jjrr 在评论中的问题，这里是一个示例用例：

from sklearn.metrics import silhouette_score as sc

def cv_silhouette_scorer(estimator, X):
    estimator.fit(X)
    cluster_labels = estimator.labels_
    num_labels = len(set(cluster_labels))
    num_samples = len(X.index)
    if num_labels == 1 or num_labels == num_samples:
        return -1
    else:
        return sc(X, cluster_labels)

cv = [(slice(None), slice(None))]
gs = GridSearchCV(estimator=sklearn.cluster.MeanShift(), param_grid=param_dict, 
                  scoring=cv_silhouette_scorer, cv=cv, n_jobs=-1)
gs.fit(df[cols_of_interest])

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Scikit Learn GridSearchCV 无需交叉验证（无监督学习）的相关文章

Django 代理模型的继承和多态性

我正在开发一个我没有启动的 Django 项目我面临着一个问题遗产我有一个大模型在示例中简化称为MyModel这应该代表不同种类的物品的所有实例对象MyModel应该具有相同的字段但方法的行为根据项目类型的不同而有很大差异到目
将数据从 python pandas 数据框导出或写入 MS Access 表

我正在尝试将数据从 python pandas 数据框导出到现有的 MS Access 表我想用已更新的数据替换 MS Access 表在 python 中我尝试使用 pandas to sql 但收到错误消息我觉得很奇怪使用 p
使用带有关键字参数的 map() 函数

这是我尝试使用的循环map功能于 volume ids 1 2 3 4 5 ip 172 12 13 122 for volume id in volume ids my function volume id ip ip 我有办法做到这一点
如何在 Python 中检索 for 循环中的剩余项目？

我有一个简单的 for 循环迭代项目列表在某些时候我知道它会破裂我该如何退回剩余的物品 for i in a b c d e f g try some func i except return remaining items if s
PyUSB 1.0：NotImplementedError：此平台不支持或未实现操作

我刚刚开始使用 pyusb 基本上我正在玩示例代码here https github com walac pyusb blob master docs tutorial rst 我使用的是 Windows 7 64 位并从以下地址下载 z
如何替换 pandas 数据框列中的重音符号

我有一个数据框dataSwiss其中包含瑞士城市的信息我想用普通字母替换带有重音符号的字母这就是我正在做的 dataSwiss Municipality dataSwiss Municipality str encode utf 8 d
根据列值突出显示数据框中的行？

假设我有这样的数据框 col1 col2 col3 col4 0 A A 1 pass 2 1 A A 2 pass 4 2 A A 1 fail 4 3 A A 1 fail 5 4 A A 1 pass 3 5 A A 2 fail 2
Spark KMeans 无法处理大数据吗？

KMeans 有几个参数training http spark apache org docs latest api python pyspark mllib html highlight kmeans pyspark mllib clus
使用 Tkinter 显示 numpy 数组中的图像

我对 Python 缺乏经验第一次使用 Tkinter 制作一个 UI 显示我的数字分类程序与 mnist 数据集的结果当图像来自 numpy 数组而不是我的 PC 上的文件路径时我有一个关于在 Tkinter 中显示图像的问题我为
Python 函数可以从作用域之外赋予新属性吗？

我不知道你可以这样做 def tom print tom s locals locals def dick z print z name z name z guest Harry print z guest z guest print di
从 Flask 访问 Heroku 变量

我已经使用以下命令在 Heroku 配置中设置了数据库变量 heroku config add server xxx xxx xxx xxx heroku config add user userName heroku config add
如何在Python中获取葡萄牙语字符？

我正在研究葡萄牙语角色看起来很奇怪我怎样才能解决这个问题代码 import feedparser import random Vou definir os feeds feeds conf feedurl http pplware s
IO 密集型任务中的 Python 多线程

建议仅在 IO 密集型任务中使用 Python 多线程因为 Python 有一个全局解释器锁 GIL 只允许一个线程持有 Python 解释器的控制权然而多线程对于 IO 密集型操作有意义吗 https stackoverflow c
无法在 Python 3 中导入 cProfile

我试图将 cProfile 模块导入 Python 3 3 0 但出现以下错误 Traceback most recent call last File
如何在Python中对类别进行加权随机抽样

给定一个元组列表其中每个元组都包含一个概率和一个项目我想根据其概率对项目进行采样例如给出列表 3 a 4 b 3 c 我想在 40 的时间内对 b 进行采样在 python 中执行此操作的规范方法是什么我查看了 random 模
Fabric env.roledefs 未按预期运行

On the 面料网站 http docs fabfile org en 1 10 usage execution html 给出这个例子 from fabric api import env env roledefs web hosts
Conda SafetyError：文件大小不正确

使用创建 Conda 环境时conda create n env name python 3 6 我收到以下警告 Preparing transaction done Verifying transaction SafetyError Th
在 Qt 中自动调整标签文本大小 - 奇怪的行为

在 Qt 中我有一个复合小部件它由排列在 QBoxLayouts 内的多个 QLabels 组成当小部件调整大小时我希望标签文本缩放以填充标签区域并且我已经在 resizeEvent 中实现了文本大小的调整这可行但似乎发生了某
从列表指向字典变量

假设你有一个清单 a 3 4 1 我想用这些信息来指向字典 b 3 4 1 现在我需要的是一个常规看到该值后在 b 的位置内读写一个值我不喜欢复制变量我想直接改变变量b的内容假设b是一个嵌套字典你可以这样做 reduce di
如何使用 Pycharm 安装 tkinter？ [复制]

这个问题在这里已经有答案了 I used sudo apt get install python3 6 tk而且效果很好如果我在终端中打开 python Tkinter 就可以工作但我无法将其安装在我的 Pycharm 项目上 pip

随机推荐

在 .NET 中解析 FIX 协议消息的最有效方法是什么？

我碰到这个非常相似的问题 https stackoverflow com questions 2311205 the best way to parse a fix message但该问题被标记为 QuickFIX 与我的问题无关并且大多
如何让Android设备始终处于唤醒模式？

设备root成功后现在我需要使设备始终处于唤醒状态即始终可见 UI 并且没有黑屏或任何白日梦屏幕为此我认为我必须完成以下任务无锁屏已关闭睡眠设置为从不白日梦设置为关闭我发现都是关于应用程序层的即有一些应用程序可以完
有什么简单的方法可以完全忽略带有 java url 连接的 ssl ？

我正在构建一个应用程序定期检查一些 RSS 提要是否有新内容其中一些提要只能通过 https 访问有些具有自签名或以某种方式损坏的证书我仍然希望能够检查它们请注意安全性在此应用程序中不是问题目标是以最小的努力访问内容我使用此
JavaScript 单选按钮

我正在尝试制作一些项目其中我希望在选择专家按钮时显示一个文本框而在单击学习者按钮时不显示文本框我已经编写了这段代码但无法解决问题请帮忙
为什么我不能将 this 指针显式传递给成员函数？

c 标准 ISO c 11 中提到第 9 3 1 节 that 可以为其类的对象调用非静态成员函数类型或从其类派生的类的对象第 10 条类型使用类成员访问语法 5 2 5 13 3 1 1 尝试使用 g 版本 4 8 2 编译此代
在 azure Web 应用程序容器上部署 .net Core 3 Linux 容器，出现 IdentityServer4 认证/http 错误

我正在尝试使用 Net Core 干净架构应用程序模板 https github com jasontaylordev CleanArchitecture并使其在容器中运行并通过 Azure CI CD 管道进行部署我在 Linux 容器
Nodejs 在 Windows 上找不到已安装的模块

我现在正在Windows上学习nodejs 使用npm cmd全局安装了几个模块 nodejs找不到已安装的模块以玉石为例 npm install jade g Jade安装在目录中 C Program Files x86 nodejs
Windows 上 PE 文件 (exe) 的最小文件大小是多少？以及最小内存分配？ [复制]

这个问题在这里已经有答案了 Windows 上 PE 文件 exe 的最小文件大小是多少以及最小内存分配我使用 VS 10 附带的 MASM ml exe 和 link exe 组装了以下代码我不能忽略 kernel32 lib 和
mysql 修改全文搜索的停用词列表

我搜索了很多据说我必须编辑 my cnf 文件来更改停用词列表我将 my medium cnf 重命名为 my cnf 并添加了 ft query expansion limit 和 ft stopword file 条件我已经重新启
修改 GGplot2 对象

然而我很好奇是否可以添加任何特定的图例或将哪个物种对应于观察到的预期绘图中以分别知道它是哪个圆圈我目前使用的是一个名为 finches 的假数据集该包称为 cooccurr 它创建一个 ggplot 对象我很好奇如何实际编辑它以
无法在 PHP shell_exec() 中运行“cd”命令

我最近在我的大学以太网连接上安装了 Apache 设置的笔记本电脑现在只要我有 IP 地址或主机名我可以选择我就可以从任何地方连接到我的计算机现在我想创建一个基于 Web 的命令提示符让我可以从任何设备在笔记本电脑上运行命令一
有没有办法阻止dll在reflector之类的软件中被打开？

你好有没有办法防止 C 中的特定 dll 在反射器中打开我可以打开许多 dll 并且可以使用反射器获取代码但是当尝试打开某些 dll 时它会显示一条错误消息指出特定 dll 不包含 CLI 标头我怎样才能制作这样的dll 您
Django 数据库迁移与 postgres 失败

我对模型做了一些更改然后运行了 python 管理 py makemigrations python 管理 py 迁移我得到了这个回溯 Operations to perform Synchronize unmigrated apps
清理 tan(x) 的图

我想形象化的根源tan xi tanh xi xi gt 0和我的情节 plot tan pi xi tanh pi xi xi 0 4 ylim 1 2 像这样出来在那里人们看到真正的根源 xi i approx pi n 1 4 n
通知中的 showInputMethodPicker 在 Android 9 中不起作用

我的应用程序有时会显示一条通知以简化切换到应用程序的内部输入法的过程因此我正在执行 InputMethodManager getSystemService INPUT METHOD SERVICE showInputMethodPic
使用 jQuery 禁用超链接

a href gohere aspx class my link Click me a I did my link attr disabled true 但没用有没有一种简单的方法可以使用 jquery 禁用超链接删除href 我宁愿不
由于垃圾收集，Haskell 程序中会出现多长时间的暂停？

关于我的另一个问题Haskell 集合可以保证每个操作的最坏情况范围 https stackoverflow com q 12393104 1333025 我很好奇垃圾收集会导致多长时间的暂停 Haskell 是否使用某种增量垃圾收集以
Python子进程Exec格式错误

抱歉如果这个问题很愚蠢我正在使用Pythonsubprocess在 Ubuntu Natty 11 04 中调用 bat 文件的语句但是我收到错误消息 Traceback most recent call last File pfa
APEX动态定义默认文件名？

在 APEX 应用程序中我有一个交互式报告 In Report Attributes gt Report Export gt Filename 您可以指定下载的默认文件名问题有没有办法动态定义这个默认文件名是的我知道用户在下载时
Scikit Learn GridSearchCV 无需交叉验证（无监督学习）

是否可以在没有交叉验证的情况下使用 GridSearchCV 我正在尝试通过网格搜索优化 KMeans 聚类中的聚类数量因此我不需要或想要交叉验证 The 文档 http scikit learn org stable modules g

Scikit Learn GridSearchCV 无需交叉验证（无监督学习）

Scikit Learn GridSearchCV 无需交叉验证（无监督学习） 的相关文章

随机推荐

热门标签

Scikit Learn GridSearchCV 无需交叉验证（无监督学习）的相关文章