MeanShift `fit` 与 `fit_predict` scikit learn

2024-03-30

Suppose X是数组的典型形式。给定代码。

from sklearn.cluster import MeanShift
ms = MeanShift(bin_seeding=True,cluster_all=False)
ms.fit(X)

一旦我这样做了,ms有两个属性:labels_ and cluster_centers_. 所以我的第一个问题是......有什么意义ms.fit_predict(X) or ms.predict(X)因为我们已经有了 X 的分类,我们可以从中读取labels_?


主要的区别在于,当你说,ms.fit(X) , X是您的标记数据集/训练数据集。说ms.fit_predict(X') , X'是您的未标记/测试数据集。即,您正在预测未标记的数据集fit_predict. i.e, fit(X)执行聚类,同时,fit_predict,为您提供聚类标签。没有什么像,ms.predict(X), on sklearn.cluster.mean_shift_.MeanShift目的。 也可以看看,dir(ms)为此,如下。

>>> help(ms.fit)
Help on method fit in module sklearn.cluster.mean_shift_:

fit(self, X) method of sklearn.cluster.mean_shift_.MeanShift instance
    Perform clustering.

    Parameters
    -----------
    X : array-like, shape=[n_samples, n_features]
        Samples to cluster.

>>> help(ms.fit_predict)
Help on method fit_predict in module sklearn.base:

fit_predict(self, X, y=None) method of sklearn.cluster.mean_shift_.MeanShift instance
    Performs clustering on X and returns cluster labels.

    Parameters
    ----------
    X : ndarray, shape (n_samples, n_features)
        Input data.

    Returns
    -------
    y : ndarray, shape (n_samples,)
        cluster labels


dir(ms)
['__class__', '__delattr__', '__dict__', '__doc__', '__format__', '__getattribute__', '__hash__', '__init__', '__module__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '__weakref__', '_get_param_names', 'bandwidth', 'bin_seeding', 'cluster_all', 'fit', 'fit_predict', 'get_params', 'min_bin_freq', 'seeds', 'set_params']

With ms具有属性为_labels & _cluster_centers, with X数据,然后您可以使用标准的错误分类惩罚技术来估计模型的优点。你不能再估计了fit_predict,因为你只会得到标签,而不是聚类中心。因此,实际上,您可以根据自己的优点标准来设计聚类中心。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

MeanShift `fit` 与 `fit_predict` scikit learn 的相关文章

随机推荐

  • 如何在 Windows 命令行中用不同的颜色进行回显

    我知道color bf命令设置整个命令行窗口的颜色 但我想以不同的颜色打印一行 我想用不同的颜色打印一行 使用 ANSI 转义序列 Windows 10 之前的 Windows 控制台上不支持 ANSI 颜色 对于 Windows 10 以
  • 如何在 Julia 1.0 中离线安装 julia 包?

    我有自己的 Julia 包 在 Julia 0 6 上运行良好 当我尝试升级到 Julia 1 0 时 我发现在 Julia 1 0 中添加我自己的包更加困难 我不能把它放在 pkg dir 下 在我的情况下 该包只是我本地磁盘上的几个文件
  • 本地 Postgres 应用程序在端口 5432 上运行,但映射到该端口的 Docker Compose 服务运行时没有错误?

    我在 MacOS 上 Postgres 应用程序在默认端口 5432 上运行 I ran docker compose up对于以下docker compose yml version 3 3 services postgresql ima
  • Git 设置最佳实践

    我的任务是为我的办公室设置 Git 我们有几个网站 我刚刚设置了一个网络驱动器供我们将更改推送到其中 我的问题是 在哪里初始化 Git 存储库 每个站点都有新的 dir init 吗 干净的新驱动器中的一个单元 每个单元用于不同的站点 我还
  • 无法运行任何 flutter 命令“flutter 工具无法访问文件或目录”

    每当我运行 flutter 命令时 包括 扑医生 扑干净 颤振通道 任何通道 etc 我收到以下错误 Gregorys MacBook Pro gregory flutter doctor Unhandled exception Excep
  • 最小宽度和最大宽度 css 媒体查询

    当使用宽度为 720px 的 Samsung Galaxy Nexus 时 这行代码不应该加载样式表 mobile large css 吗 但事实并非如此 这是什么原因以及如何解决 我也在用这个 可能你必须定义device width而不是
  • 如何根据单元格条件将列变成行?

    以下是我的数据示例 Omschrijving AMM AM FG G K MOTRED MINI BPM RVM MOTRED STM RMI MOTRED 1 x magneetplug 1 1 1 1 1 1 2 x afwaterin
  • 第一个弹出窗口显示过时的状态

    我发现了一个符合我口味的弹出窗口的奇怪行为 我希望它显示一个视图PopoverItem and number 两者均应从onTapGesture in ForEach 问题是弹出窗口总是显示默认值number第一次点击时 它会按预期工作 错
  • 枚举的编译时查找表

    我有一个枚举列表 其定义如下 enum PinEnum kPinInvalid kPinA0 kPinA1 kPinB0 kPinB1 kPinC0 kPinC1 每个枚举都需要与其他两个值相关联 即端口和引脚号 目前 我通过运行时函数访问
  • 更改背景图像的不透明度

    我有一个带有文本块的 div 元素和一个父 div 我在其中设置了背景图像 现在我想降低背景图像的不透明度 我怎样才能做到这一点 EDIT 我希望通过编辑 html 内容来改变我的博客文章在 blogger com 上的显示方式 html
  • Java 系统属性的范围

    在Java中我们使用System setProperty 方法来设置一些系统属性 根据本文 http blogs oracle com foo entry monitored system setproperty系统属性的使用有点棘手 Sy
  • 在每个页面上缓存包含特定于会话的数据的 Drupal 站点

    我们有一个用 Drupal 6 编写的网站 我们想使用Drupal的缓存机制来提高性能 但是当我们打开它时 我们发现了问题 因为我们的站点每个页面都显示会话数据 Drupal 的缓存系统仅适用于静态内容页面 而我们的会话数据实际上意味着我们
  • AWS API Gateway CORS 飞行前检查失败

    我正在使用 Zappa 来部署我的应用程序 cors 已启用 并且当按下 API Gateway OPTIONS 资源中选项上的 test 按钮时 一切似乎都工作正常 但是 当我尝试进行 CORS 飞行前检查时 我收到了 500 错误 me
  • Bigquery 将列添加到表架构

    我正在尝试向 BigQuery 现有表添加新列 我尝试过 bq 命令工具和 API 方法 调用 Tables update 时出现以下错误 我尝试过提供带有附加字段的完整架构 这也给了我相同的错误 如下所示 使用 API 我收到以下错误 s
  • 将 ParameterExpression 与 org.springframework.data.jpa.domain.Specification 一起使用时如何将参数传递给函数?

    我使用 org springframework data jpa domain Specification 与 JpaSpecificationExecutor 一起轻松创建带有 Java 条件的查询 但现在我需要调用返回整数值的 MySQ
  • 奇怪的“在所有成员初始化之前被闭包捕获的‘self’”错误

    请看一下下面的代码 class A let a String let b String init a String b String self a a self b b class B A let c Bool private let aE
  • 连接字符串存储在哪里

    我正在创建一个类库 其中包含我在开发的应用程序中经常使用的所有自定义类 该库被编译并作为参考添加到我的每个应用程序中 使我能够调用该库中包含的自定义类 我的库中的自定义类包括多层继承 但它们最终都起源于我称为 Alpha 的基类 在该类中
  • 在 Java 中重新排列 ArrayList 的最佳方法

    重新排列列表中元素的最佳方法是什么 我需要能够移动元素来移动列表中的元素 在索引中后退或前进一步 我正在考虑获取该项目的索引 将其添加到索引 1 2 处并删除旧引用 是否有一种更快的方法来处理重新排列 而无需在此过程中在列表中创建重复项 使
  • WordPress 标题:如果长度超过 50 个字符,则显示省略号

    我有一个带有标题的 WordPress 网站 如果标题超过 50 个字符 我需要添加省略号 位于标题末尾 并将标题停在 50 个字符处 下面是我正在编写的 PHP 但它似乎无法正常工作 The mb strimwidth http www
  • MeanShift `fit` 与 `fit_predict` scikit learn

    Suppose X是数组的典型形式 给定代码 from sklearn cluster import MeanShift ms MeanShift bin seeding True cluster all False ms fit X 一旦