scipy 链接格式

2024-01-14

我已经编写了自己的聚类例程,并希望生成树状图。最简单的方法是使用 scipy dendrogram 函数。但是,这要求输入的格式与 scipy 链接函数生成的格式相同。我找不到如何格式化输出的示例。我想知道是否有人可以启发我。


我同意https://stackoverflow.com/users/1167475/mortonjt https://stackoverflow.com/users/1167475/mortonjt该文档没有完全解释中间集群的索引,虽然我确实同意https://stackoverflow.com/users/1354844/dkar https://stackoverflow.com/users/1354844/dkar格式另有明确解释。

使用此问题中的示例数据:scipy.cluster.hierarchy 教程 https://stackoverflow.com/questions/21638130/tutorial-for-scipy-cluster-hierarchy

A = np.array([[0.1,   2.5],
              [1.5,   .4 ],
              [0.3,   1  ],
              [1  ,   .8 ],
              [0.5,   0  ],
              [0  ,   0.5],
              [0.5,   0.5],
              [2.7,   2  ],
              [2.2,   3.1],
              [3  ,   2  ],
              [3.2,   1.3]])

可以使用单个(即最接近的匹配点)构建链接矩阵:

z = hac.linkage(a, method="single")

 array([[  7.        ,   9.        ,   0.3       ,   2.        ],
        [  4.        ,   6.        ,   0.5       ,   2.        ],
        [  5.        ,  12.        ,   0.5       ,   3.        ],
        [  2.        ,  13.        ,   0.53851648,   4.        ],
        [  3.        ,  14.        ,   0.58309519,   5.        ],
        [  1.        ,  15.        ,   0.64031242,   6.        ],
        [ 10.        ,  11.        ,   0.72801099,   3.        ],
        [  8.        ,  17.        ,   1.2083046 ,   4.        ],
        [  0.        ,  16.        ,   1.5132746 ,   7.        ],
        [ 18.        ,  19.        ,   1.92353841,  11.        ]])

正如文档所解释的,n 以下的簇(此处:11)只是原始矩阵 A 中的数据点。接下来的中间簇将连续索引。

因此,聚类 7 和 9(第一次合并)合并为聚类 11,聚类 4 和 6 合并为 12。然后观察第三行,合并聚类 5(来自 A)和 12(来自未显示的中间聚类 12),结果为簇内距离 (WCD) 为 0.5。单一方法要求新的 WCS 为 0.5,这是 A[5] 与聚类 12 中最近点 A[4] 和 A[6] 之间的距离。让我们检查:

 In [198]: norm([a[5]-a[4]])
 Out[198]: 0.70710678118654757
 In [199]: norm([a[5]-a[6]])
 Out[199]: 0.5

该簇现在应该是中间簇 13,随后与 A[2] 合并。因此,新距离应该是点 A[2] 和 A[4,5,6] 之间最近的距离。

 In [200]: norm([a[2]-a[4]])
 Out[200]: 1.019803902718557
 In [201]: norm([a[2]-a[5]])
 Out[201]: 0.58309518948452999
 In [202]: norm([a[2]-a[6]])
 Out[202]: 0.53851648071345048

可以看出,其中也检查并解释了新簇的中间格式。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

scipy 链接格式 的相关文章

  • 如何计算 pandas datetime 对象的均值和方差?

    如何计算 YYYY MM DD 形式的 python 日期时间对象的汇总统计数据 均值和标准差 我想对具有不同 ID 的不同日期时间对象组执行此操作 数据如下 import datetime as dt df pd DataFrame Da
  • Python - 比较同一字典中的值

    我有一本字典 d Trump MAGA FollowTheMoney Clinton dems Clinton Stein FollowTheMoney Atlanta 我想删除字符串列表中的重复字符串 该字符串是键的值 对于这个例子 期望
  • 计算另一个字符串中多个字符串的出现次数

    在 Python 2 7 中 给定以下字符串 Spot是一只棕色的狗 斑点有棕色的头发 斑点的头发是棕色的 查找字符串中 Spot brown 和 hair 总数的最佳方法是什么 在示例中 它将返回 8 我正在寻找类似的东西string c
  • 在 Celery 任务中调用 Google Cloud API 永远不会返回

    我正在尝试拨打外部电话Google Cloud Natural Language API从一个内Celery任务 使用google cloud python包裹 问题是对 API 的调用永远不会返回 挂起 celery task def g
  • 多输出堆叠回归器

    一次性问题 我正在尝试构建一个多输入堆叠回归器 添加到 sklearn 0 22 据我了解 我必须结合StackingRegressor and MultiOutputRegressor 经过多次尝试 这似乎是正确的顺序 import nu
  • 更好地相当于这个疯狂的嵌套 python for 循环

    for a in map for b in map a for c in map b for d in map c for e in map d print a b c d e 上面的代码用于创建图中一定长度的所有路径 map a 表示从
  • Pycharm 在 os.path 连接上出现“未解析的引用”

    将pycharm升级到2018 1 并将python升级到3 6 5后 pycharm报告 未解析的引用 join 最新版本的 pycharm 不会显示以下行的任何警告 from os path import join expanduser
  • Tensorboard SyntaxError:语法无效

    当我尝试制作张量板时 出现语法错误 尽管开源代码我还是无法理解 我尝试搜索张量板的代码 但不清楚 即使我不擅长Python 我这样写路径C Users jh902 Documents logs因为我正在使用 Windows 10 但我不确定
  • GUI(输入和输出矩阵)?

    我需要创建一个 GUI 将数据输入到矩阵或表格中并读取此表单数据 完美的解决方案是限制输入表单仅允许float 例如 A 1 02 0 25 0 30 0 515 0 41 1 13 0 15 1 555 0 25 0 14 1 21 2
  • python的shutil.move()在linux上是原子的吗?

    我想知道python的shutil move在linux上是否是原子的 如果源文件和目标文件位于两个不同的分区上 行为是否不同 或者与它们存在于同一分区上时的行为相同吗 我更关心的是如果源文件和目标文件位于同一分区上 shutil move
  • 通过Python连接到Bigquery:ProjectId和DatasetId必须非空

    我编写了以下脚本来通过 SDK 将 Big Query 连接到 Python 如下所示 from google cloud import bigquery client bigquery Client project My First Pr
  • pandas - 包含时间序列数据的堆积条形图

    我正在尝试使用时间序列数据在 pandas 中创建堆积条形图 DATE TYPE VOL 0 2010 01 01 Heavy 932 612903 1 2010 01 01 Light 370 612903 2 2010 01 01 Me
  • 如何使用 Python 3 检查目录是否包含文件

    我到处寻找这个答案但找不到 我正在尝试编写一个脚本来搜索特定的子文件夹 然后检查它是否包含任何文件 如果包含 则写出该文件夹的路径 我已经弄清楚了子文件夹搜索部分 但检查文件却难倒了我 我发现了有关如何检查文件夹是否为空的多个建议 并且我尝
  • 在 Google App Engine 中,如何避免创建具有相同属性的重复实体?

    我正在尝试添加一个事务 以避免创建具有相同属性的两个实体 在我的应用程序中 每次看到新的 Google 用户登录时 我都会创建一个新的播放器 当新的 Google 用户在几毫秒内进行多个 json 调用时 我当前的实现偶尔会创建重复的播放器
  • 如果 PyPy 快 6.3 倍,为什么我不应该使用 PyPy 而不是 CPython?

    我已经听到很多关于PyPy http en wikipedia org wiki PyPy项目 他们声称它比现有技术快 6 3 倍CPython http en wikipedia org wiki CPython口译员开启他们的网站 ht
  • 制作一份 Python 文档的 PDF 文件

    Python 官方网站提供 PDF 文档下载 但它们是按章节分隔的 我下载了源代码并构建了 PDF 文档 这些文档也是单独的 PDF 我怎么能够从源代码中的 Makefile 构建一个 PDF 文件 我认为这样阅读起来会更方便 如果连接单独
  • 如何使用 PrimaryKeyRelatedField 更新多对多关系上的类别

    Django Rest 框架有一个主键相关字段 http www django rest framework org api guide relations primarykeyrelatedfield其中列出了我的 IDmany to m
  • 将索引与值交换的最快方法

    考虑pd Series s s pd Series list abcdefghij list ABCDEFGHIJ s A a B b C c D d E e F f G g H h I i J j dtype object 交换索引和值并
  • JSON:TypeError:Decimal('34.3')不是JSON可序列化的[重复]

    这个问题在这里已经有答案了 我正在运行一个 SQL 查询 它返回一个小数列表 当我尝试将其转换为 JSON 时 出现类型错误 查询 res db execute SELECT CAST SUM r SalesVolume 1000 0 AS
  • NLTK:查找单词大小为 2k 的上下文

    我有一个语料库 我有一个词 对于语料库中该单词的每次出现 我想获取一个包含该单词之前的 k 个单词和该单词之后的 k 个单词的列表 我在算法上做得很好 见下文 但我想知道 NLTK 是否提供了一些我错过的功能来满足我的需求 def size

随机推荐

  • 检查 Excel 中的组合?

    我有两道多项选择题 有 9 种可能的选择 总共有 20 种答案组合 每个组合都被分配一个值 在 Excel 中 我需要检查不同组合的答案并告诉我该组合的值 这怎么可能 我需要使用什么公式 问答示例 可能的答案 这是我尝试过的方法 它有效 但
  • 如何加快file_get_contents的速度?

    这是我的代码 language GET soundtype word GET sound word urlencode word if language english url
  • 使用 Ransack gem 进行复选框搜索

    我需要过滤表中的数据 为此 我发现元搜索 https github com ernie meta search宝石 我安装了 meta search 并收到此错误 uninitialized constantActiveRecord Ass
  • PHP - SimpleXML - AddChild 与另一个 SimpleXMLElement

    我正在尝试构建一个相当复杂的 XML 文档 我的 XML 文档中有很多重复的部分 我想我应该使用多个字符串模板作为这些部分的基础文档 并使用 simplexml load string 创建 XML 元素的实例 所以我有一个 SimpleX
  • 带有 @nguniversal 的 Angular SSR 和用于 PostCSS 支持的自定义 webpack

    我的 Angular 10 2 1 应用程序使用自定义 webpack 构建器在 scss 文件中提供 PostCSS 支持 在 SPA 模式下工作得非常好 角度 json build builder angular builders cu
  • Equals() 与静态 string.Equals()

    在阅读 C 中的字符串比较时 我发现了很多方法来比较 2 个字符串以查看它们是否相等 我已经习惯了 来自 C 但我了解到 如果将对象与字符串进行比较 那么 默认为参考值 或类似的值 那么对于Equals 方法可以说我有 2 个字符串 str
  • 尝试让 Spring/Consul/Vault 协同工作

    我正在尝试做一些我认为简单的事情 我想用Consul https www consul io用于配置 以及Vault https www vaultproject io为了秘密 我正在寻找一个像这样的简单应用程序 它允许我从 Consul
  • 在 Mac 上哪里可以找到 bashrc 文件?

    你好我正在关注这个page http docs python guide org en latest starting install osx 我正在我的 mac 上安装 Python 以便我可以设置Django Eclipse开发环境 但
  • 覆盖 google.com 匿名函数的一部分

    如果一个 javascript 函数是匿名声明的 有什么方法可以覆盖它或它的一部分吗 我试图阻止 google com 的即时搜索劫持向上和向下箭头键以在您的搜索排名中移动 我已经确定了我认为有问题的代码部分 键码 38 和 40 用于向下
  • 如何自定义魅力报告标题和徽标

    下面附上通过 allure 生成的 allure 报告图像 想要使用我自己的标题和徽标而不是 ALLURE REPORT 和默认徽标来自定义报告标题和徽标 图像突出显示为黄色 感谢你的帮助 要更改徽标 您应该将自定义徽标插件放入插件文件夹中
  • 如何正确删除和重新添加实体数据模型

    这里是实体框架的新手 使用VS 2010和SQL Server 2008 Express DB 添加新表后 我在刷新实体数据模型时遇到问题 因此 我遵循了在这里找到的建议 删除并重新生成模型 我进入实体数据模型向导的 选择您的数据连接 部分
  • 根据格式为 %d/%m/%Y 的日期按时间顺序排序数据帧

    我有一些数据必须格式化为 d m Y 数据不按时间顺序排列 因为它是按第一个数字 日而不是月份 排序的 我希望我能指定order or reorder我希望排序以不同的方式进行 我只是不知道该怎么做 以下是一些要订购的日期数据 date 1
  • 相当于 Struts 1.x“bean:define”标签?

    我正在致力于将旧的 Struts 1 x 应用程序转换为 Spring MVC 并且在一些 JSP 页面中 bean define标签用于从资源包中获取字符串 然后在页面中稍后使用
  • 如何查找 Active Directory OAuth 身份验证的受众字段? (如何从 Azure 逻辑应用程序向 DevOps 发送发布请求?)

    请帮我解决这个问题 我正在尝试从 Azure 逻辑应用程序向 DevOps 发送发布请求以创建发布 我在逻辑应用程序中创建了一个 http 操作 这是用于创建发布的 uri https vsrm dev azure com https vs
  • 清理遗留代码“header spaghetti”

    任何清理 标题意大利面 的推荐做法 这会导致极其严重的后果 编译时间慢 Linux Unix GCC 中是否有相当于 pragma Once 的东西 发现与此相关的冲突消息 Thanks 假设您熟悉 包含防护 ifdef 在标头开头 加快构
  • 使用 opencv 从 SIFT 生成百分比相似度分数

    在 python 2 7 x opencv 2 4 9 中使用 SIFT 比较两个图像后 我一直试图找到一种生成相似性得分 以 为单位 的方法 我只能找到在比赛之间画线的例子 我该怎么做呢 Matlab 中有一个相当于 vl ubcmatc
  • 在 for 循环中等待点击事件 - 类似于prompt()

    这可能没有最伟大的标题 我试图理解回调函数 我想知道如何在不丢失 for 循环的情况下替换以下代码中的提示 for i 0 i lt 4 i let x prompt Input an integer store input into an
  • JAXB 解组验证抛出 cvc-elt.1: 找不到元素声明错误

    我对 JAXB 和验证有点陌生 并且花了几个小时试图解决这个问题 但无济于事 我创建了一个简单的 JAXB 解组器示例来解析 XML 文件 我也创建了一个适当的 XSD 文件 但验证器一直抱怨它无法找到元素的声明 我认为这可能与命名空间问题
  • 从多列表框中取消选择时如何获取当前选定的选项值

    您好 我有如下所示的多选列表框 div class id 100 div
  • scipy 链接格式

    我已经编写了自己的聚类例程 并希望生成树状图 最简单的方法是使用 scipy dendrogram 函数 但是 这要求输入的格式与 scipy 链接函数生成的格式相同 我找不到如何格式化输出的示例 我想知道是否有人可以启发我 我同意http