字符串的“相关矩阵”。名义数据的相似度

2024-05-06

这是我的数据框。 df

  store_1      store_2         store_3         store_4     

0 banana      banana           plum            banana
1 orange      tangerine        pear            orange
2 apple       pear             melon           apple
3 pear        raspberry        pineapple       plum
4 plum        tomato           peach           tomato

我正在寻找计算商店中同时出现的次数的方法（以比较它们的相似性）。

你可以尝试这样的事情

import itertools as it
corr = lambda a,b: len(set(a).intersection(set(b)))/len(a)
c = [corr(*x) for x in it.combinations_with_replacement(df.T.values.tolist(),2)]

j = 0
x = []
for i in range(4, 0, -1): # replace 4 with df.shape[-1]
    x.append([np.nan]*(4-i) + c[j:j+i])
    j+= i
pd.DataFrame(x, columns=df.columns, index=df.columns)

哪个产量

        store_1 store_2 store_3 store_4
store_1 1.0     0.4     0.4     0.8
store_2 NaN     1.0     0.2     0.4
store_3 NaN     NaN     1.0     0.2
store_4 NaN     NaN     NaN     1.0

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python3x

pandas

DataFrame

correlation

字符串的“相关矩阵”。名义数据的相似度的相关文章

为 Anaconda Python 安装 psycopg2

我有 Anaconda Python 3 4 但是每当我运行旧代码时我都会通过输入 source activate python2 切换到 Anaconda Python 2 7 我的问题是我为 Anaconda Python 3 4 安
Python（Selenium）：如何通过登录重定向/组织登录登录网站

我不是专业程序员所以请原谅任何愚蠢的错误我正在做一些研究我正在尝试使用 Selenium 登录数据库来搜索大约 1000 个术语我有两个问题 1 重定向到组织登录页面后如何使用 Selenium 登录 2 如何检索数据库在我解决
使用 matplotlib 绘制时间序列数据并仅在年初显示年份

rcParams date autoformatter month b n Y 我正在使用 matpltolib 来绘制时间序列如果我按上述方式设置 rcParams 则生成的图会在每个刻度处标记月份名称和年份我怎样才能将其设置为仅在每
如何在 Python 中检索 for 循环中的剩余项目？

我有一个简单的 for 循环迭代项目列表在某些时候我知道它会破裂我该如何退回剩余的物品 for i in a b c d e f g try some func i except return remaining items if s
如何使用 Ansible playbook 中的 service_facts 模块检查服务是否存在且未安装在服务器中？

我用过service facts检查服务是否正在运行并启用在某些服务器中未安装特定的软件包现在我如何知道这个特定的软件包没有安装在该特定的服务器上service facts module 在 Ansible 剧本中它显示以下错误
如何从网页中嵌入的 Tableau 图表中抓取工具提示值

我试图弄清楚是否有一种方法以及如何使用 python 从网页中的 Tableau 嵌入图形中抓取工具提示值以下是当用户将鼠标悬停在条形上时带有工具提示的图表示例我从要从中抓取的原始网页中获取了此网址 https covid19 colo
是否可以忽略一行的pyright检查？

我需要忽略一行的pyright 检查有什么特别的评论吗 def create slog group SLogGroup data Optional dict None SLog insert one SLog group group da
使用 Tkinter 显示 numpy 数组中的图像

我对 Python 缺乏经验第一次使用 Tkinter 制作一个 UI 显示我的数字分类程序与 mnist 数据集的结果当图像来自 numpy 数组而不是我的 PC 上的文件路径时我有一个关于在 Tkinter 中显示图像的问题我为
如何使用 OpencV 从 Firebase 读取图像？

有没有使用 OpenCV 从 Firebase 读取图像的想法或者我必须先下载图片然后从本地文件夹执行 cv imread 功能有什么办法我可以使用cv imread link of picture from firebase 您可以
IO 密集型任务中的 Python 多线程

建议仅在 IO 密集型任务中使用 Python 多线程因为 Python 有一个全局解释器锁 GIL 只允许一个线程持有 Python 解释器的控制权然而多线程对于 IO 密集型操作有意义吗 https stackoverflow c
在f字符串中转义字符[重复]

这个问题在这里已经有答案了我遇到了以下问题f string gt gt gt a hello how to print hello gt gt gt f a a gt gt gt f a File
python获取上传/下载速度

我想在我的计算机上监控上传和下载速度一个名为 conky 的程序已经在 conky conf 中执行了以下操作 Connection quality alignr wireless link qual perc wlan0 downspe
Fabric env.roledefs 未按预期运行

On the 面料网站 http docs fabfile org en 1 10 usage execution html 给出这个例子 from fabric api import env env roledefs web hosts
向 Altair 图表添加背景实心填充

I like Altair a lot for making graphs in Python As a tribute I wanted to regenerate the Economist graph s in Mistakes we
如何在seaborn displot中使用hist_kws

我想在同一图中用不同的颜色绘制直方图和 kde 线我想为直方图设置绿色为 kde 线设置蓝色我设法弄清楚使用 line kws 来更改 kde 线条颜色但 hist kws 不适用于显示我尝试过使用 histplot 但我无法为
每个 X 具有多个 Y 值的 Python 散点图

我正在尝试使用 Python 创建一个散点图其中包含两个 X 类别 cat1 cat2 每个类别都有多个 Y 值如果每个 X 值的 Y 值的数量相同我可以使用以下代码使其工作 import numpy as np import mat
有没有办法检测正在运行的代码是否正在上下文管理器内执行？

正如标题所述有没有办法做到这样的事情 def call back if called inside context print running in context else print called outside context 这将
使用 Python 绘制 2D 核密度估计

I would like to plot a 2D kernel density estimation I find the seaborn package very useful here However after searching
Scrapy：如何使用元在方法之间传递项目

我是 scrapy 和 python 的新手我试图将 parse quotes 中的项目 item author 传递给下一个解析方法 parse bio 我尝试了 request meta 和 response meta 方法如 sc
neo4j - python 驱动程序，服务不可用

我对 neo4j 非常陌生我正在尝试建立从 python3 6 到 neo4j 的连接我已经安装了驱动程序并且刚刚开始执行第一步导入请求导入操作系统导入时间导入urllib 从 neo4j v1 导入 GraphDatabas

随机推荐

Gnuplot：具有置信区间的线点

我有以下数据我想绘制一个图表显示所有 x 与线线点连接的平均值并显示所有置信区间 ci lower ci upper 我设法使用 2 个图来做到这一点 set xrange 0 1100000 set yrange 0 5000
如何用 Java 或 C# 等语言实现统一算法？

我正在读我拿到的人工智能教科书我已经解决了我的部分的最后一个作业问题以您选择的任何语言实施第 69 页概述的统一算法在第 69 页您有以下统一算法的伪代码 function unify E1 E2 begin case both E
Codeigniter - 错误 - 没有要更新的数据

我本来要更新数据库但收到错误没有要更新的数据这是我的脚本我创建了一个简单的切换来更新数据库切换使用户处于活动状态 is active 1 或非活动状态 is active 0 我遇到的问题是虽然对象从 1 更改为 0 或 0 更
如何在 Node.js 中等待

这是一个关于我认为 Node js 中的简单模式的问题这是我在 CoffeeScript 中的示例 db is open false db open gt db is open true wait gt wait until db is
如何使ggplot2图形与R中的黑白打印（复印友好）兼容？

有没有办法转换ggplot2绘制成黑白版本而不重写大部分代码以便黑白版本保持可读性例如要替换scale fill gradient with scale fill grey 或者自动进行适合复印的转换如网站http colorbre
使用带有代码分割的汇总时，有什么方法可以保留包的目录结构吗？

Context 给定这样的项目结构 src a module js b module js util js 两者都在哪里module js文件导入util js 使用以下配置 export default experimentalCodeS
自 1.4.0 版本以来，sphinx_rtd_theme 不再是硬依赖项

C Users Administrator Desktop item code serv documents api gt 制作 html 运行 Sphinx v1 6 2 加载腌制环境失败无法获取属性 WarningStream
Spring MVC 415 不支持的媒体类型

我正在使用 Spring 3 2 并尝试使用 ajax post 请求来提交 json 对象数组如果这是相关的我转义了所有特殊字符我收到的 HTTP 状态为 415 我的控制器是 RequestMapping value save p
类型特征的 _t 别名和 _v 变量模板的目的是什么？

有a lot of v and t后缀例如std is same v std invoke result t result of t以及数百万个其他此类功能 Why它们到底存在吗在任何情况下公开实施细节例如std result of
利用 SSE 和其他 CPU 扩展

在我的代码库中有几个地方对于大型数据集相同的操作会重复很多次在某些情况下处理这些需要花费相当长的时间我相信使用SSE来实现这些循环应该可以显着提高它们的性能特别是在对同一组数据执行许多操作的情况下因此一旦数据最初被读入缓存就
当键是复合键时，metaData.getPrimaryKeys() 返回单行

我在使用 SQLite 驱动程序的 JDBC 中遇到复合主键问题 The getPrimaryKeys 方法从DatabaseMetaData当我验证该键实际上是由两列组成的复合键时对象返回单行有人对如何检索主键的真实列表有任何建议替
文件路径在棒棒糖android中始终返回null

这是我从内部存储画廊获取图像时的代码在棒棒糖文件路径中返回始终为空 if requestCode PICK IMAGE if resultCode RESULT OK image successfully picked launchi
*y++ 和 ++*y 之间的区别？

我对这段代码将如何执行感到困惑假设我们有 int x 30 y z y x y 和 y 和有什么不一样该程序的输出是什么 include
重新索引存储库循环 - 不是 Maven

我的 Eclipse 继续崩溃运行一个循环显示重新索引存储库 myusername 我认为这是因为 github 但我没有检查 Maven 和 GitHub 下的 eclipse 首选项中可能导致问题的所有内容有人可以帮忙吗我的电脑一
MS Access 不支持连接表达式吗？

谁能向我解释我的查询有什么问题吗 SELECT T2 TIPOPRODUTO T2 PRODUTO T1 ESPESSURA AS LARGURA AS COMPRIMENTO AS ACABAM REVEST AS ESPECIF QUA
根据 R 中另一个数据帧中给出的条件，用 NA 替换数据帧中的多个值

使用 R 我想根据另一个数据框中包含的条件将数据框中的数值替换为 NA An example data frame with numeric values I want to change to NA based on values giv
有没有办法在 Dapper 中同时使用 MultiMapping 和 QueryMultiple？

我有一些需要一起运行的查询我可以使用查询多个特征但在这种情况下我无法找出如何使用多重映射有谁知道实现这一目标的方法吗我认为这就是您正在寻找的内容尽管如果没有您尝试执行的查询的示例很难判断 var sql Select From
在 C# 中打开的资源管理器窗口中获取文件/目录列表

我试图拉出打开的资源管理器窗口中列出的文件和目录列表与显示的顺序相同以便我可以查看它然后将焦点设置到特定项目我找到了这段代码here https stackoverflow com questions 14193388 how to
如何从 Richfaces 弹出窗口刷新父 jsf 页面

我有一个包含几个字段的 JSF 页面我跟着这个tutorial http balusc blogspot com 2011 01 jsf 20 tutorial with eclipse and html来自 BalusC 一切都很好然
字符串的“相关矩阵”。名义数据的相似度

这是我的数据框 df store 1 store 2 store 3 store 4 0 banana banana plum banana 1 orange tangerine pear orange 2 apple pear melon

字符串的“相关矩阵”。名义数据的相似度

字符串的“相关矩阵”。名义数据的相似度 的相关文章

随机推荐

热门标签

字符串的“相关矩阵”。名义数据的相似度的相关文章