计算一组集合之间的相似度

2024-01-19

假设有4组:

s1={1,2,3,4};
s2={2,3,4};
s3={2,3,4,5};
s4={1,3,4,5};

有没有一个标准的度量来表示这组4组的相似程度?

感谢您对Jaccard方法的建议。然而,这似乎是成对的。 如何计算整组集合的相似度?


成对地,你可以计算杰卡德距离 http://en.wikipedia.org/wiki/Jaccard_distance两套。它只是两个集合之间的距离,如果它们是空间中的布尔向量,其中 {1, 2, 3…} 都是单位向量。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

计算一组集合之间的相似度 的相关文章

  • 计算混淆矩阵的更快方法?

    我正在计算图像语义分割的混淆矩阵 如下所示 这是一种非常冗长的方法 def confusion matrix preds labels conf m sample size preds normalize preds 0 9 returns
  • 如何计算Python中包含字符串的两个列表的杰卡德相似度?

    我有两个包含用户名的列表 我想计算 Jaccard 相似度 是否可以 This https stackoverflow com questions 11911252 python jaccard distance using word in
  • 词干提取的逆过程

    我使用 lucene 雪球分析器来执行词干提取 结果是没有意义的话 我提到了这个question https stackoverflow com questions 190775 stemming algorithm that produc
  • 将石墨指标偏移当前时间范围内的最低值

    我有带有 Graphite 指标的 Grafana 我有一个图表显示EnqueueCountActiveMQ 中的某些特定队列 问题是EnqueueCount显示自创建队列以来的所有值 因此当我将 Grafana 中的时间范围缩小到 今天到
  • Python(NumPy)中相似度矩阵的高效计算

    Let X be a Bxn numpy矩阵 即 import numpy as np B 10 n 2 X np random random B n 现在 我对计算所谓的内核 甚至相似度 矩阵感兴趣K 其形状为BxB 及其 i j th
  • 运行 pod 和节点的 Kubernetes prometheus 指标?

    我已经设置了 prometheus 通过遵循 prometheus 来监控 kubernetes 指标文档 https github com prometheus docs blob master content docs operatin
  • 两个十六进制数的相似度

    我试图使用汉明和编辑距离找到类似的哈希值 十六进制哈希值 假设两个哈希值相似 如果它们的汉明距离小于 10 不同位数 Hash 1 ffffff base 16 Hash 2 fffff0 base 16 两个哈希之间的汉明距离是4 它们是
  • 如何从多个 python-flask 子进程收集普罗米修斯指标?

    我有 main 函数 它生成两个单独的子进程 这两个子流程共享指标 如何共享两个流程的指标并保持更新 这是我的片段 以供更多理解 from multiprocessing import Process import prometheus c
  • Spring Integration 通道统计指标

    不知怎的 我没有捕捉到 Spring Integration Metrics 内容 我想要的是关于每秒有多少消息通过消息通道 最小和最大吞吐量是多少的统计输出 如果我使用newTicketChannel getSendRate 然后我变成以
  • 在 Django 模型中使用 Trigram (gin_trgm_ops) 创建 Gin 索引

    django contrib postgres 的新 TrigramSimilarity 功能非常适合解决我遇到的问题 我用它作为搜索栏来查找难以拼写的拉丁名字 问题是名字超过 200 万个 搜索时间比我想要的要长 我想在三元组上创建一个索
  • 无法查看使用 spring 指标注释捕获的指标

    我怎样才能做相当于 Override public void init final ServletConfig config throws ServletException super init config CsvReporter ena
  • Java 项目的 SLOC

    我需要一个免费工具来计算 Java 项目的 SLOC 我只需要以下指标 SLOC 注释行数 可选地javadoc 指标 可选地按文件类型 java js css html xml 等 对统计信息进行排序 Bonus 100 Java 我不喜
  • 如何在 Keras 中定义自定义精度以忽略具有特定金色标签的样本?

    我想在 Keras 中编写一个自定义指标 我正在使用张量流后端 相当于categorical accuracy 但是具有特定金色标签的样本的输出 在我的例子中是 0 来自 y true 必须被忽略 例如 如果我的输出是 预测 1 金 0 预
  • 无法在 Spring Boot 2(版本 2.0.0.M7)中包含 Prometheus 指标

    无法在 Spring Boot 2 版本 2 0 0 M7 项目中包含 Prometheus 指标 根据千分尺文档 https micrometer io docs ref spring 2 0 prometheus added sprin
  • 如何找到两条曲线之间的相似度以及相似度得分?

    我有两个数据集 t y1 和 t y2 这些数据集在视觉上看起来相同 但它们存在一些时间延迟或幅度变化 我想找到两条曲线之间的相似度 对于近似相似的曲线给出相似度得分 1 对于不相似的曲线给出相似度得分 0 由于数据的波动 一些曲线似乎有所
  • Tensorflow 中的平衡准确度分数

    我正在为高度不平衡的分类问题实现 CNN 并且我想在张量流中实现自定义指标以使用 选择最佳模型 回调 具体来说 我想实现平衡的准确度分数 这是每个类别的召回率的平均值 请参阅 sklearn 实现here https scikit lear
  • Eclipse 指标插件建议[关闭]

    Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我正在寻找一个工具来为我提供一些代码指标 LOC 总数 LOC 类 外部引用 类的数量等 有谁知道一个
  • 查找重复邮寄地址的策略

    我正在尝试想出一种根据相似度分数查找重复地址的方法 考虑这些重复的地址 addr 1 3 FAIRMONT LINK SOUTH addr 2 3 FAIRMONT LINK S addr 3 5703 48TH AVE adrr 4 57
  • R 忽略空值的矩阵列的成对比较

    我有一个数组 我想获取它之间的相似度的度量values在每一列中 我的意思是我希望比较数组的成对列之间的行 并在它们的值匹配时增加一个度量 对于两列来说 所得的测量值最大值将完全相同 本质上我的问题与这里讨论的相同 R 两两比较矩阵中的所有
  • “gld/st_throughput”和“dram_read/write_throughput”指标之间有什么区别?

    在 CUDA 可视化分析器版本 5 中 我知道 gld st requested throughput 是应用程序请求的内存吞吐量 然而 当我试图找到硬件的实际吞吐量时 我很困惑 因为有两对似乎合格的指标 它们是 gld st throug

随机推荐

  • C++ 中的不透明值是什么?

    C 中的 不透明值 是什么 不透明 在英语中的定义是 不能被看穿 不透明 在计算机科学中 这意味着除了值本身的类型之外不显示任何细节的值 人们经常使用C型FILE作为经典的例子 但通常这是not不透明 细节显示在stdio h任何人都可以看
  • 如何使用 CIColorControls 通过 UISlider 和 Swift 更改亮度、对比度和饱和度

    我正在开发一个照片滤镜应用程序 正如你所看到的 我添加了一个功能来调整对比度 亮度 饱和度和噪音 但问题是它们是独立工作的 这意味着当我开始编辑对比度时调整亮度时 它会返回到原始亮度 这是当我将亮度设置为最大 图像变白 然后尝试调整其对比度
  • 使用 Jquery,将表中的一行替换为新行

    假设我有一张桌子 table tr class old row td 1 td td 2 td td class edit Edit td tr tr class old row td 1 td td 2 td td class edit
  • 在多个音乐文件上运行命令行

    我正在使用一个名为 metaflac 的 CLI 程序 http flac sourceforge net documentation tools metaflac html http flac sourceforge net docume
  • 适用于 Android 的 Google 地图我的位置自定义按钮

    如何更改谷歌地图我的位置默认按钮 我设置了位置启用并在地图上绘制标准图像来查找位置 是否可以更改默认图像 请参阅下面的自定义按钮 xml 文件
  • dart 中的逆映射

    假设我在 dart 中有以下地图 Map f 0 0 1 1 2 0 3 1 4 0 5 1 dart中有没有什么东西可以让你轻松使用地图的逆图f 例如 逆映射f 0 用数学符号表示 应该等于集合0 2 4在这种情况下 如果值是唯一的 那么
  • 如何在ios7中以编程方式将地图颜色从白天更改为晚上

    我正在开发一个适用于 iOS 7 的应用程序 并尝试将地图从白天更改为夜间模式 将夜间模式更改为白天模式 我在 iOS 7 文档中没有找到任何相关的 API 来执行此操作 这不是内置功能MKMapKit所以你所要求的如果不自己做是不可能的
  • Jupyter Notebook 不允许我在多行中输入 MySQL 查询

    如上所述 我无法在 Jupyter 中多行输入查询 这很烦人 因为编写和读取我自己的查询比较困难 有没有办法切换多行和单行输入 我已经用谷歌搜索了好几次 但文档似乎没有多大帮助 PS 找到了输入 sql 而不是 sql 的愚蠢解决方案 使用
  • 如何在 GLSL / WebGL 中将 1 个 32 位整数打包为 4 个 8 位整数?

    我正在寻求并行化一些复杂的数学 而 WebGL 看起来是实现这一目标的完美方法 问题是 您只能从纹理中读取 8 位整数 理想情况下 我希望从纹理中获取 32 位数字 我的想法是使用 4 个颜色通道来获得每像素 32 位 而不是 4 乘以 8
  • 为什么 DateDiff 返回日期而不是分钟数?

    我需要找出两个字符串之间存在多少分钟 h1 TimeValue 06 00 00 h2 TimeValue 22 00 00 res DateDiff n h1 h2 然而 res 17 08 1902 而预期结果是 960 Sub cal
  • 让 AdView 实际显示

    我的 google adview 有问题 它没有显示 我挖了一段时间 发现人们对填充有问题 所以我去掉了填充 但仍然没有运气 这是我的相关清单数据
  • 如何将div内的img向右对齐?

    我想知道如何将div内的图像对齐到右侧 可以给周边div a text align right 这将在图像左侧留下空白区域 图像将占据整行 如果您希望内容显示在图像的左侧 请使用 float right 在图像上 然而 周边div然后将需要
  • Viewbag.Title 错误:找不到编译动态表达式所需的一种或多种类型。您是否缺少参考资料?

    我有一个 ASP NET MVC 5 Web 应用程序 在每个 cshtml 视图文件中 我收到以下错误Viewbag 找不到编译动态表达式所需的一种或多种类型 您是否缺少参考资料 我引用了 Microsoft CSharp dll 和 S
  • 如何使用 PyQt5 在 qml 中设置值?

    我想从 PyQt5 将值写入 qml 该值动态变化 例如 矩形文本值是从 Pyqt5 归档的 Rectangle width 75 height 75 text values from PyQt5 如果你想从 python 修改 QML 属
  • jQuery 醉酒插件。对焦触发不起作用

    我一直在通过 jQuery 工具提示插件进行过滤 并发现有点醉意 它由 GitHub 使用 这是我大部分决定的基础 我真的很喜欢它 而且它真的很容易使用 但我有一个问题 我需要工具提示在焦点上淡入 而不是悬停 目前它可以工作 但只能在悬停时
  • primefaces selectonemenu 更改事件不适用于空值

    我有一个包含一些项目的选择菜单 还有一个空项目用于显示 请选择一个 我的目标是当我选择其中之一时查询一些数据 如果我选择 请选择一个 则做另一件事 但最终 更改事件会针对正常值被触发 但如果我选择 请选择一个 项目 则不会触发它 感谢您的帮
  • HTML 中的上标文本

    是否可以在值字段中使用上标文本
  • SVN Changelist 与 Git 等效吗?

    只是好奇 Git 是否有类似 Subversions Changelist 功能 我发现它在运行中使用非常方便 我知道我可以运行类似的东西 cat changelistfileimade xargs git update 但我很好奇是否也有
  • android 内存不足:没有更多的后台进程?需要帮忙

    我面临内存不足的问题 Low memory no more background process这是场景 我正在使用一个从字符串数组获取数据的列表 它有一个自定义背景 单击项目 列表会获取另一个字符串数组以显示为第二级或第三级 数据库中写入
  • 计算一组集合之间的相似度

    假设有4组 s1 1 2 3 4 s2 2 3 4 s3 2 3 4 5 s4 1 3 4 5 有没有一个标准的度量来表示这组4组的相似程度 感谢您对Jaccard方法的建议 然而 这似乎是成对的 如何计算整组集合的相似度 成对地 你可以计