sklearn凝聚聚类：动态更新聚类数量

2023-12-11

sklearn.cluster.AgglomerativeClustering 的文档提到，

当改变集群数量并使用缓存时，计算完整的树可能是有利的。

这似乎意味着可以首先计算完整的树，然后根据需要快速更新所需集群的数量，而无需重新计算树（使用缓存）。

然而，改变集群数量的过程似乎没有记录。我想这样做，但不确定如何继续。

更新：为了澄清，拟合方法不将簇数作为输入：http://scikit-learn.org/stable/modules/ generated/sklearn.cluster.AgglomerativeClustering.html#sklearn.cluster.AgglomerativeClustering.fit

您可以使用参数设置缓存目录memory = 'mycachedir'然后如果你设置compute_full_tree=True，当你重新运行时fit具有不同的值n_clusters，它将使用缓存的树而不是每次都重新计算。给您一个如何使用 sklearn 的 gridsearch API 执行此操作的示例：

from sklearn.cluster import AgglomerativeClustering
from sklearn.grid_search import GridSearchCV

ac = AgglomerativeClustering(memory='mycachedir', 
                             compute_full_tree=True)
classifier = GridSearchCV(ac, 
                          {n_clusters: range(2,6)}, 
                          scoring = 'adjusted_rand_score', 
                          n_jobs=-1, verbose=2)
classifier.fit(X,y)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

sklearn凝聚聚类：动态更新聚类数量的相关文章

如何传递架构以从现有数据帧创建新数据帧？

要将 schema 传递到 json 文件我们这样做 from pyspark sql types import StructField StringType StructType IntegerType data schema Stru
Pandas set_levels，如何避免标签排序？

我使用时遇到问题set levels多索引 from io import StringIO txt Name Height Age Metres A 1 25 B 95 1 df pd read csv StringIO txt heade
Python 类型提示 Dict 语法错误可变默认值是不允许的。使用“默认工厂”

我不知道为什么解释器会抱怨这个类型的字典对于这两个实例我得到一个不允许可变默认值使用默认工厂语法错误我使用的是 python 3 7 3 from dataclasses import dataclass from typing
为什么 dataclasses.astuple 返回类属性的深层副本？

在下面的代码中astuple函数正在执行数据类的类属性的深层复制为什么它不能产生与函数相同的结果my tuple import copy import dataclasses dataclasses dataclass class Dem
NLTK 2.0分类器批量分类器方法

当我运行此代码时它会抛出一个错误我认为这是由于 NLTK 3 0 中不存在batch classify 方法我很好奇如何解决旧版本中的某些内容在新版本中消失的此类问题 def accuracy classifier gold resu
嵌套列表的重叠会产生不必要的间隙

我有一个包含三个列表的嵌套这些列表由 for 循环填充并且填充由 if 条件控制第一次迭代后它可能类似于以下示例 a 1 2 0 0 0 0 0 0 4 5 0 0 0 0 0 0 6 7 根据条件它们不重叠在第二次迭代之后新
python multiprocessing 设置生成进程等待

是否可以生成一些进程并将生成进程设置为等待生成的进程完成下面是我用过的一个例子 import multiprocessing import time import sys def daemon p multiprocessing curr
Tensorboard SyntaxError：语法无效

当我尝试制作张量板时出现语法错误尽管开源代码我还是无法理解我尝试搜索张量板的代码但不清楚即使我不擅长Python 我这样写路径C Users jh902 Documents logs因为我正在使用 Windows 10 但我不确定
GUI（输入和输出矩阵）？

我需要创建一个 GUI 将数据输入到矩阵或表格中并读取此表单数据完美的解决方案是限制输入表单仅允许float 例如 A 1 02 0 25 0 30 0 515 0 41 1 13 0 15 1 555 0 25 0 14 1 21 2
如何将特定范围内的标量添加到 numpy 数组？

有没有一种更简单更节省内存的方法可以单独在 numpy 中执行以下操作 import numpy as np ar np array a l r ar c a a 0 l ar tolist a r 它可能看起来很原始但它涉及获取给定数
使用 Python Oauthlib 通过服务帐户验证 Google API

我不想使用适用于 Python 的 Google API 客户端库但仍想使用 Python 访问 Google APIOauthlib https github com idan oauthlib 创建服务帐户后谷歌开发者控制台 http
导入错误：没有名为flask.ext.login的模块

我的flask login 模块有问题我已经成功安装了flask login模块另外从命令提示符我可以轻松运行此脚本不会出现错误 Python 2 7 r27 82525 Jul 4 2010 07 43 08 MSC v 1500
通过Python连接到Bigquery：ProjectId和DatasetId必须非空

我编写了以下脚本来通过 SDK 将 Big Query 连接到 Python 如下所示 from google cloud import bigquery client bigquery Client project My First Pr
Django 视图中的“请求”是什么

在 Django 第一个应用程序的 Django 教程中我们有 from django http import HttpResponse def index request return HttpResponse Hello world
尽管我已在 python ctypes 中设置了信号处理程序，但并未调用它

我尝试过使用 sigaction 和 ctypes 设置信号处理程序我知道它可以与python中的信号模块一起使用但我想尝试学习当我向该进程发送 SIGTERM 时但它没有调用我设置的处理程序只打印终止为什么它不调用处理程序
将 Matlab 的 datenum 格式转换为 Python

我刚刚开始从 Matlab 迁移到 Python 2 7 在读取 mat 文件时遇到一些问题时间信息以 Matlab 的日期数字格式存储对于那些不熟悉它的人日期序列号将日历日期表示为自固定基准日期以来已经过去的天数在 MATLAB
如何使用 Boto3 启动具有 IAM 角色的 EC2 实例？

我无法弄清楚如何使用指定的 IAM 角色在 Boto3 中启动 EC2 实例以下是迄今为止我如何成功创建实例的一些示例代码 import boto3 ec2 boto3 resource ec2 region name us west 2
如何使用 PrimaryKeyRelatedField 更新多对多关系上的类别

Django Rest 框架有一个主键相关字段 http www django rest framework org api guide relations primarykeyrelatedfield其中列出了我的 IDmany to m
如何将Python3设置为Mac上的默认Python版本？

有没有办法将 Python 3 8 3 设置为 macOS Catalina 版本 10 15 2 上的默认 Python 版本我已经完成的步骤看看它安装在哪里 ls l usr local bin python 我得到的输出是这样的
如何在Python脚本中从youtube-dl中提取文件大小？

我是 python 编程新手我想在下载之前提取视频音频大小任何 YouTube 视频 gt gt gt from youtube dl import YoutubeDL gt gt gt url https www youtube c

随机推荐

在 Kafka 流作业中进行同步数据库查询或静态调用是一个好习惯吗？

我使用Kafka Streams来处理实时数据在Kafka Streams任务中我需要访问MySQL来查询数据并且需要调用另一个Restful服务所有操作都是同步的恐怕同步调用会降低流任务的处理能力这是一个好的做法吗或者有什么
命令模式下的垂直 vim 光标

我在 Mac 上我将终端光标设置为竖线选项然而在 vim 命令模式下光标是竖线但它不会让我使用 hjkl 转到行尾它总是在行尾之前停止这尤其令人烦恼因为您必须在插入模式下使用箭头键才能使光标到达行尾任何修复将不胜感激例如
Grep 中“单词”的含义

在 grep 的手册页中它说 gt The symbols lt and gt respectively match the empty string at the gt beginning and end of a word 这里的词是什
将收到的订单 woocommerce 发送给经销商并发送电子邮件通知

我有一个电子邮件经销商列表当我在 wp admin 中收到订单时我需要打开此订单并将此订单发送给经销商商业用户每个经销商都有一封电子邮件并在已发送给该经销商的自定义字段中标记此订单在我的 woocommerce 订单页面中
Clang 相当于 GCC 的 -mwindows

我知道如何指示 GCC 使用the mwindows flag 使用以下命令生成 PEIMAGE SUBSYSTEM WINDOWS GUI而不是IMAGE SUBSYSTEM WINDOWS CUI Windows子系统 Clang 提供
如何更改构建配置以便 cmd 指向 python 解释器的实际位置？

当我尝试通过 Sublime Text 2 运行 python 或任何语言时它只说 Error 2 The system cannot find the file specified cmd u python u u u C Users
datepicker 禁用基于时间的日期

我的网站上有一个日期选择器但现在我想禁用基于时间的日期我想实现两件事我想禁用今天用户不应该能够选择今天的日期每天下午 2 00 后我也想明天禁用通过jquery可以吗根据一天中的时间更改 minDate 怎么样 var hou
C++ 函数定义和变量声明不匹配？

考虑这个非常简单的代码 include
如何使用 cypress 从 Mailslurp 中的确认电子邮件中提取链接？

我试图提取一个链接以使用 Cypress 和 Mailslurp 继续进行用户注册为此我编写了以下代码 let inboxId let emailAddress describe sign up gt beforeEach gt cy
从iOS设备通过POST方法将数据插入远程mysql数据库

我有3个价值观 id name email 我有三个UIText我可以在其中提供这些输入并将这些值保存到远程数据库中的字段我用GET方法来实现它我没有问题但是如果我想做同样的事情POST方法那么我该怎么做我认为下面现有的代码会有一
如何模拟 InString[]？

我发现InString 不适用于MathLink发送输入时的模式EnterExpressionPacket标头所以我需要定义自己的函数来返回上一个输入行我开发的一种方法here在某些情况下不起作用 In 1 Unevaluated 2
使用 ggplot2 自动绘制所有 data.table 列的最佳方法

我正在尝试利用高级技巧data table and ggplot2创建一个简单而强大的函数自动绘制在一张图像中任意的所有列 y data table作为输入列 x 的函数可选地以列 k 为条件这样我们就可以使用单行快速可视化所有数
如何使用叠加视图录制视频

您好我正在尝试使用叠加录制视频我已经写了 void addOvelayViewToVideo NSURL videoURL 在录制的视频上添加叠加视图但它不起作用我编写了录制视频的代码viewDidLoad using AVCapt
如何将 800x480 5 英寸屏幕分成两部分

我正在使用 Raspberry Pi 3 model b 构建一个独立的 VR 耳机我在手机上看到的分割屏幕时遇到问题我仍在学习 Python 所以我不太了解如何做到这一点在此代码中我尝试解决上述问题但是当我在 Raspbian
Context.startForegroundService() 然后没有调用 Service.startForeground

我的应用程序将调用startForegroundService intent in the onCreate of the MainActivity 我把startForeground ON SERVICE CONNECTION NID n
将对象发送到 WCF 服务。反序列化时超出 MaxStringContentLength（8192 字节）

我创建了一个简单的 WCF Web 服务它有一个方法 SubmitTicket flightticket ft string username string password 在客户端我有一个用于填写表格机票并将其发送到这个新创建的
MacOS OmniSharp 在 vscode 中超时错误

今天早上我启动了 vscode 1 13 1 并想用 C dotnet core 编写代码但我遇到了同样的错误您可以在 google 中找到该错误但在当前版本的 OmniSharp 中 Omnisharp 正确地看到了我的项目但没有
从 Java 调用存储过程

我正在尝试从我的 Java 应用程序调用 mySQL 存储过程当我从 mySQL 工作台调用存储过程时它可以工作并且根据我发送的参数获得正确的行数当我尝试从 Java 调用它时问题就出现了我没有得到任何结果也找不到原因我一直
验证当前经过身份验证的 Windows 用户是否具有委派权限

鉴于我有一个使用 Windows 身份验证的 WCF 服务并且我想模拟它们并调用另一个 WCF 服务如下所示 using ServiceSecurityContext Current WindowsIdentity Impersonat
sklearn凝聚聚类：动态更新聚类数量

sklearn cluster AgglomerativeClustering 的文档提到当改变集群数量并使用缓存时计算完整的树可能是有利的这似乎意味着可以首先计算完整的树然后根据需要快速更新所需集群的数量而无需重新计算树使用缓

sklearn凝聚聚类：动态更新聚类数量

sklearn凝聚聚类：动态更新聚类数量 的相关文章

随机推荐

热门标签

sklearn凝聚聚类：动态更新聚类数量的相关文章