MeanShift `fit` 与 `fit_predict` scikit learn

2024-03-30

Suppose X是数组的典型形式。给定代码。

from sklearn.cluster import MeanShift
ms = MeanShift(bin_seeding=True,cluster_all=False)
ms.fit(X)

一旦我这样做了，ms有两个属性：labels_ and cluster_centers_. 所以我的第一个问题是......有什么意义ms.fit_predict(X) or ms.predict(X)因为我们已经有了 X 的分类，我们可以从中读取labels_?

主要的区别在于，当你说，ms.fit(X) , X是您的标记数据集/训练数据集。说ms.fit_predict(X') , X'是您的未标记/测试数据集。即，您正在预测未标记的数据集fit_predict. i.e, fit(X)执行聚类，同时，fit_predict，为您提供聚类标签。没有什么像，ms.predict(X), on sklearn.cluster.mean_shift_.MeanShift目的。也可以看看，dir(ms)为此，如下。

>>> help(ms.fit)
Help on method fit in module sklearn.cluster.mean_shift_:

fit(self, X) method of sklearn.cluster.mean_shift_.MeanShift instance
    Perform clustering.

    Parameters
    -----------
    X : array-like, shape=[n_samples, n_features]
        Samples to cluster.

>>> help(ms.fit_predict)
Help on method fit_predict in module sklearn.base:

fit_predict(self, X, y=None) method of sklearn.cluster.mean_shift_.MeanShift instance
    Performs clustering on X and returns cluster labels.

    Parameters
    ----------
    X : ndarray, shape (n_samples, n_features)
        Input data.

    Returns
    -------
    y : ndarray, shape (n_samples,)
        cluster labels


dir(ms)
['__class__', '__delattr__', '__dict__', '__doc__', '__format__', '__getattribute__', '__hash__', '__init__', '__module__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '__weakref__', '_get_param_names', 'bandwidth', 'bin_seeding', 'cluster_all', 'fit', 'fit_predict', 'get_params', 'min_bin_freq', 'seeds', 'set_params']

With ms具有属性为_labels & _cluster_centers, with X数据，然后您可以使用标准的错误分类惩罚技术来估计模型的优点。你不能再估计了fit_predict，因为你只会得到标签，而不是聚类中心。因此，实际上，您可以根据自己的优点标准来设计聚类中心。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

scikitlearn

MeanShift `fit` 与 `fit_predict` scikit learn 的相关文章

Scikit Learn - K-Means - 肘部 - 标准

今天我想学习一些关于 K means 的知识我已经了解该算法并且知道它是如何工作的现在我正在寻找正确的 k 我发现肘部准则作为检测正确的 k 的方法但我不明白如何将它与 scikit learn 一起使用在 scikit learn
将预训练的手套词嵌入与 scikit-learn 结合使用

我已经使用 keras 来使用预先训练的词嵌入但我不太确定如何在 scikit learn 模型上执行此操作我也需要在 sklearn 中执行此操作因为我正在使用vecstack集成 keras 序列模型和 sklearn 模型这就
sklearn：使用 Pipeline 和 TransformedTargetRegressor 缩放 x（数据）和 y（目标）

我想使用 Pipeline 和 TransformedTargetRegressor 来处理所有缩放数据和目标是否可以混合 Pipeline 和 TransformedTargetRegressor 如何从 TransformedTar
scikit-learn 和tensorflow 有什么区别？可以一起使用它们吗？

对于这个问题我无法得到满意的答案据我了解 TensorFlow是一个数值计算库经常用于深度学习应用而Scikit learn是一个通用机器学习框架但它们之间的确切区别是什么 TensorFlow 的目的和功能是什么我可以一起使用它
如何指定聚类的距离函数？

我想对给定距离的点进行聚类奇怪的是似乎 scipy 和 sklearn 聚类方法都不允许指定距离函数例如在sklearn cluster AgglomerativeClustering 我唯一可以做的就是输入一个亲和力矩阵这将非常
Sklearn 随机 Logistic 回归给出错误“ValueError：类的数量必须大于 1”

我发现了 sklearn Randomized Logistic 中的一个错误由于我花了很长时间才解决它所以我会将其发布在这里以防其他人遇到同样的问题发生的情况是在格式完美的数据上 sklearn RandomizedLogist
pydev 调试器：严重警告：此版本的 python 似乎编译不正确（内部生成的文件名不是绝对的）[重复]

这个问题在这里已经有答案了通过运行 from sklearn datasets import fetch california housing import pandas as pd pd set option precision 4 m
sklearn LogisticRegressionCV 是否使用最终模型的所有数据

我想知道sklearn中LogisticRegressionCV的最终模型即决策边界是如何计算的假设我有一些 Xdata 和 ylabels Xdata shape of this is n samples n features yl
使用 scikit-learn 进行二次采样 + 分类

我正在使用 Scikit learn 进行二元分类任务并且我有 0 级有 200 个观察值第 1 类有 50 个观察值而且因为我有不平衡的数据我想抽取多数类的随机子样本其中观察数量与少数类相同并且希望使用新获得的数据集作为分
混淆矩阵不支持多标签指示符

multilabel indicator is not supported是我在尝试运行时收到的错误消息 confusion matrix y test predictions y test is a DataFrame其形状为 Horse
GridSearchCV.best_score 与 cross_val_score 不同（GridSearchCV.best_estimator_）

考虑以下网格搜索 grid GridSearchCV clf parameters n jobs 1 iid True cv 5 grid fit grid fit X train1 y train1 根据 Sklearn 的资源 grid
如何使用FeatureUnion转换PipeLine中的多个特征？

我有一个 pandas 数据框其中包含有关用户发送的消息的信息对于我的模型我感兴趣的是预测消息的缺失收件人即给定消息的收件人 A B C 我想预测还有谁应该成为收件人的一部分我正在使用 OneVsRestClassifier 和
如何获取 sklearn.metrics.classification_report 的输出作为字典？

我一直在尝试以字典的形式获得分类报告所以根据 scikit learn 0 20 文档我这样做 from sklearn import metrics rep metrics classification report y true y
python sklearn中的fit方法

我问自己关于 sklearn 中拟合方法的各种问题问题1 当我这样做时 from sklearn decomposition import TruncatedSVD model TruncatedSVD svd 1 model fit X
Python：由于 OSError 无法安装软件包：[Errno 2] 没有这样的文件或目录

我尝试使用pip安装sklearn 并且我收到以下错误消息错误由于 OSError 无法安装软件包 Errno 2 没有这样的文件或目录 C Users 13434 AppData Local Packages PythonSoftwa
使用 Doc2vec 后如何解释 Clusters 结果？

我正在使用 doc2vec 将关注者的前 100 条推文转换为矢量表示形式例如 v1 v100 之后我使用向量表示来进行 K 均值聚类 model Doc2Vec documents t size 100 alpha 035 windo
Sklearn SVM：SVR 和 SVC，为每个输入获得相同的预测

这是代码的粘贴支持向量机示例代码 http pastebin com dvWy5SpE 我查看了这个问题的其他几个答案看起来这个问题的特定迭代有点不同首先我的输入被标准化每个点有五个输入这些值的大小都合理健康的 0 5 秒和
如何将 sklearn.naive_bayes 与（多个）分类特征一起使用？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我想学习朴素贝叶斯模型来解决类为布尔值的问题有些特征是布尔型的但其他特征是分类型的并且可以采用少量值 5 如果我所有的功能都是布尔值
为什么 scikit learn 的平均精度分数返回 nan？

我的 Keras 模型旨在接收两个输入时间序列将它们连接起来通过 LSTM 提供它们并在下一个时间步骤中进行多标签预测有 50 个训练样本每个样本有 24 个时间步每个样本有 5625 个标签有 12 个验证样本每个样本有
Scikit-learn - ValueError：输入包含 NaN、无穷大或对于随机森林的 dtype('float32') 来说太大的值

首先我检查了有关此错误的不同帖子但没有一个可以解决我的问题因此我使用随机森林并且能够生成森林并进行预测但有时在森林的生成过程中我会收到以下错误 ValueError 输入包含 NaN 无穷大或对于 dtype float32

随机推荐

如何在 Windows 命令行中用不同的颜色进行回显

我知道color bf命令设置整个命令行窗口的颜色但我想以不同的颜色打印一行我想用不同的颜色打印一行使用 ANSI 转义序列 Windows 10 之前的 Windows 控制台上不支持 ANSI 颜色对于 Windows 10 以
如何在 Julia 1.0 中离线安装 julia 包？

我有自己的 Julia 包在 Julia 0 6 上运行良好当我尝试升级到 Julia 1 0 时我发现在 Julia 1 0 中添加我自己的包更加困难我不能把它放在 pkg dir 下在我的情况下该包只是我本地磁盘上的几个文件
本地 Postgres 应用程序在端口 5432 上运行，但映射到该端口的 Docker Compose 服务运行时没有错误？

我在 MacOS 上 Postgres 应用程序在默认端口 5432 上运行 I ran docker compose up对于以下docker compose yml version 3 3 services postgresql ima
Git 设置最佳实践

我的任务是为我的办公室设置 Git 我们有几个网站我刚刚设置了一个网络驱动器供我们将更改推送到其中我的问题是在哪里初始化 Git 存储库每个站点都有新的 dir init 吗干净的新驱动器中的一个单元每个单元用于不同的站点我还
无法运行任何 flutter 命令“flutter 工具无法访问文件或目录”

每当我运行 flutter 命令时包括扑医生扑干净颤振通道任何通道 etc 我收到以下错误 Gregorys MacBook Pro gregory flutter doctor Unhandled exception Excep
最小宽度和最大宽度 css 媒体查询

当使用宽度为 720px 的 Samsung Galaxy Nexus 时这行代码不应该加载样式表 mobile large css 吗但事实并非如此这是什么原因以及如何解决我也在用这个可能你必须定义device width而不是
如何根据单元格条件将列变成行？

以下是我的数据示例 Omschrijving AMM AM FG G K MOTRED MINI BPM RVM MOTRED STM RMI MOTRED 1 x magneetplug 1 1 1 1 1 1 2 x afwaterin
第一个弹出窗口显示过时的状态

我发现了一个符合我口味的弹出窗口的奇怪行为我希望它显示一个视图PopoverItem and number 两者均应从onTapGesture in ForEach 问题是弹出窗口总是显示默认值number第一次点击时它会按预期工作错
枚举的编译时查找表

我有一个枚举列表其定义如下 enum PinEnum kPinInvalid kPinA0 kPinA1 kPinB0 kPinB1 kPinC0 kPinC1 每个枚举都需要与其他两个值相关联即端口和引脚号目前我通过运行时函数访问
更改背景图像的不透明度

我有一个带有文本块的 div 元素和一个父 div 我在其中设置了背景图像现在我想降低背景图像的不透明度我怎样才能做到这一点 EDIT 我希望通过编辑 html 内容来改变我的博客文章在 blogger com 上的显示方式 html
Java 系统属性的范围

在Java中我们使用System setProperty 方法来设置一些系统属性根据本文 http blogs oracle com foo entry monitored system setproperty系统属性的使用有点棘手 Sy
在每个页面上缓存包含特定于会话的数据的 Drupal 站点

我们有一个用 Drupal 6 编写的网站我们想使用Drupal的缓存机制来提高性能但是当我们打开它时我们发现了问题因为我们的站点每个页面都显示会话数据 Drupal 的缓存系统仅适用于静态内容页面而我们的会话数据实际上意味着我们
AWS API Gateway CORS 飞行前检查失败

我正在使用 Zappa 来部署我的应用程序 cors 已启用并且当按下 API Gateway OPTIONS 资源中选项上的 test 按钮时一切似乎都工作正常但是当我尝试进行 CORS 飞行前检查时我收到了 500 错误 me
Bigquery 将列添加到表架构

我正在尝试向 BigQuery 现有表添加新列我尝试过 bq 命令工具和 API 方法调用 Tables update 时出现以下错误我尝试过提供带有附加字段的完整架构这也给了我相同的错误如下所示使用 API 我收到以下错误 s
将 ParameterExpression 与 org.springframework.data.jpa.domain.Specification 一起使用时如何将参数传递给函数？

我使用 org springframework data jpa domain Specification 与 JpaSpecificationExecutor 一起轻松创建带有 Java 条件的查询但现在我需要调用返回整数值的 MySQ
奇怪的“在所有成员初始化之前被闭包捕获的‘self’”错误

请看一下下面的代码 class A let a String let b String init a String b String self a a self b b class B A let c Bool private let aE
连接字符串存储在哪里

我正在创建一个类库其中包含我在开发的应用程序中经常使用的所有自定义类该库被编译并作为参考添加到我的每个应用程序中使我能够调用该库中包含的自定义类我的库中的自定义类包括多层继承但它们最终都起源于我称为 Alpha 的基类在该类中
在 Java 中重新排列 ArrayList 的最佳方法

重新排列列表中元素的最佳方法是什么我需要能够移动元素来移动列表中的元素在索引中后退或前进一步我正在考虑获取该项目的索引将其添加到索引 1 2 处并删除旧引用是否有一种更快的方法来处理重新排列而无需在此过程中在列表中创建重复项使
WordPress 标题：如果长度超过 50 个字符，则显示省略号

我有一个带有标题的 WordPress 网站如果标题超过 50 个字符我需要添加省略号位于标题末尾并将标题停在 50 个字符处下面是我正在编写的 PHP 但它似乎无法正常工作 The mb strimwidth http www
MeanShift `fit` 与 `fit_predict` scikit learn

Suppose X是数组的典型形式给定代码 from sklearn cluster import MeanShift ms MeanShift bin seeding True cluster all False ms fit X 一旦

MeanShift `fit` 与 `fit_predict` scikit learn

MeanShift `fit` 与 `fit_predict` scikit learn 的相关文章

随机推荐

热门标签