Pandas 两个分组的 DataFrame 列的简单关联

2024-03-12

有没有一种好方法来获取两个分组的 DataFrame 列的简单关联?

看来无论熊猫怎样.corr()函数想要返回一个相关矩阵。例如。,

i = pd.MultiIndex.from_product([['A','B','C'], np.arange(1, 11, 1)], names=['Name','Num'])
test = pd.DataFrame(np.random.randn(30, 2), i, columns=['X', 'Y'])
test.groupby(['Name'])['X','Y'].corr()

returns

               X         Y
Name                      
A    X  1.000000  0.152663
     Y  0.152663  1.000000
B    X  1.000000 -0.155113
     Y -0.155113  1.000000
C    X  1.000000  0.214197
     Y  0.214197  1.000000

但显然我只对非对角线项感兴趣。计算四个值然后尝试选择我想要的值似乎很笨拙,如下所示

test.groupby(['Name'])['X','Y'].corr().ix[0::2,'Y']

to get

A     X    0.152663
B     X   -0.155113
C     X    0.214197

我期待类似的东西test.groupby('Name')['X'].corr('Y')工作,但它没有,当你通过系列本身时(test['Y'])它变得更慢。在这一点上,似乎 apply 是最好的选择:

test.groupby('Name').apply(lambda df: df['X'].corr(df['Y']))
Out: 
Name
A   -0.484955
B    0.520701
C    0.120879
dtype: float64

这会迭代每个组并在每个分组的 DataFrame 中应用 Series.corr。差异是由于没有设置随机种子而产生的。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Pandas 两个分组的 DataFrame 列的简单关联 的相关文章

  • 如何等到 Excel 计算公式后再继续 win32com

    我有一个 win32com Python 脚本 它将多个 Excel 文件合并到电子表格中并将其另存为 PDF 现在的工作原理是输出几乎都是 NAME 因为文件是在计算 Excel 文件内容之前输出的 这可能需要一分钟 如何强制工作簿计算值
  • R 中的列乘以子字符串

    假设我有一个数据框 其中包含多个组件及其在多个列中列出的属性 并且我想对这些列运行多个函数 我的方法是尝试将其基于每个列标题中的子字符串 但我无法弄清楚如何做到这一点 下面是数据框的示例 Basket F Type 1 F Qty 1 F
  • SQL Alchemy 中的 NULL 安全不等式比较?

    目前 我知道如何表达 NULL 安全的唯一方法 SQL Alchemy 中的比较 其中与 NULL 条目的比较计算结果为 True 而不是 NULL 是 or field None field value 有没有办法在 SQL Alchem
  • 如何使用 Scrapy 从网站获取所有纯文本?

    我希望在 HTML 呈现后 可以从网站上看到所有文本 我正在使用 Scrapy 框架使用 Python 工作 和xpath body text 我能够获取它 但是带有 HTML 标签 而且我只想要文本 有什么解决办法吗 最简单的选择是ext
  • keras加载模型错误尝试将包含17层的权重文件加载到0层的模型中

    我目前正在使用 keras 开发 vgg16 模型 我用我的一些图层微调 vgg 模型 拟合我的模型 训练 后 我保存我的模型model save name h5 可以毫无问题地保存 但是 当我尝试使用以下命令重新加载模型时load mod
  • 使用 Pycharm 在 Windows 下启动应用程序时出现 UnicodeDecodeError

    问题是当我尝试启动应用程序 app py 时 我收到以下错误 UnicodeDecodeError utf 8 编解码器无法解码位置 5 中的字节 0xb3 起始字节无效 整个文件app py coding utf 8 from flask
  • 将数据框中重叠的范围合并到唯一的组中

    我有一个 n 行 3 的数据框 df lt data frame start c 178 400 983 1932 33653 end c 5025 5025 5535 6918 38197 group c 1 1 2 2 3 df sta
  • 在pyyaml中表示具有相同基类的不同类的实例

    我有一些单元测试集 希望将每个测试运行的结果存储为 YAML 文件以供进一步分析 YAML 格式的转储数据在几个方面满足我的需求 但测试属于不同的套装 结果有不同的父类 这是我所拥有的示例 gt gt gt rz shorthand for
  • Python:字符串不会转换为浮点数[重复]

    这个问题在这里已经有答案了 我几个小时前写了这个程序 while True print What would you like me to double line raw input gt if line done break else f
  • Pandas Dataframe 中 bool 值的条件前向填充

    问题 如何转发 fill boolTruepandas 数据框中的值 如果是当天的第一个条目 True 到一天结束时 请参阅以下示例和所需的输出 Data import pandas as pd import numpy as np df
  • 当玩家触摸屏幕一侧时,如何让 pygame 发出警告?

    我使用 pygame 创建了一个游戏 当玩家触摸屏幕一侧时 我想让 pygame 给出类似 你不能触摸屏幕两侧 的错误 我尝试在互联网上搜索 但没有找到任何好的结果 我想过在屏幕外添加一个方块 当玩家触摸该方块时 它会发出警告 但这花了很长
  • Geopandas 设置几何图形:MultiPolygon“等于 len 键和值”的 ValueError

    我有 2 个带有几何列的地理数据框 我将一些几何图形从 1 个复制到另一个 这对于多边形效果很好 但对于任何 有效 多多边形都会返回 ValueError 请指教如何解决这个问题 我不知道是否 如何 为什么应该更改 MultiPolygon
  • 如何将 numpy.matrix 提高到非整数幂?

    The 运算符为numpy matrix不支持非整数幂 gt gt gt m matrix 1 0 0 5 0 5 gt gt gt m 2 5 TypeError exponent must be an integer 我想要的是 oct
  • Numpy 优化

    我有一个根据条件分配值的函数 我的数据集大小通常在 30 50k 范围内 我不确定这是否是使用 numpy 的正确方法 但是当数字超过 5k 时 它会变得非常慢 有没有更好的方法让它更快 import numpy as np N 5000
  • 在 Pandas DataFrame Python 中添加新列[重复]

    这个问题在这里已经有答案了 例如 我在 Pandas 中有数据框 Col1 Col2 A 1 B 2 C 3 现在 如果我想再添加一个名为 Col3 的列 并且该值基于 Col2 式中 如果Col2 gt 1 则Col3为0 否则为1 所以
  • 在 Python 类中动态定义实例字段

    我是 Python 新手 主要从事 Java 编程 我目前正在思考Python中的类是如何实例化的 我明白那个 init 就像Java中的构造函数 然而 有时 python 类没有 init 方法 在这种情况下我假设有一个默认构造函数 就像
  • Spark.read 在 Databricks 中给出 KrbException

    我正在尝试从 databricks 笔记本连接到 SQL 数据库 以下是我的代码 jdbcDF spark read format com microsoft sqlserver jdbc spark option url jdbc sql
  • Python - 字典和列表相交

    给定以下数据结构 找出这两种数据结构共有的交集键的最有效方法是什么 dict1 2A 3A 4B list1 2A 4B Expected output 2A 4B 如果这也能产生更快的输出 我可以将列表 不是 dict1 组织到任何其他数
  • Pandas 与 Numpy 数据帧

    看这几行代码 df2 df copy df2 1 df 1 df 1 values 1 df2 ix 0 0 我们的教练说我们需要使用 values属性来访问底层的 numpy 数组 否则我们的代码将无法工作 我知道 pandas Data
  • PyAudio ErrNo 输入溢出 -9981

    我遇到了与用户相同的错误 Python 使用 Pyaudio 以 16000Hz 录制音频时出错 https stackoverflow com questions 12994981 python error audio recording

随机推荐

  • iOS - NSJSONSerialization:无法将数据转换为字符周围的字符串

    我在解析 JSON 时收到此错误 NSDictionary json NSJSONSerialization JSONObjectWithData data options NSJSONReadingMutableContainers er
  • 最快的 ArangoDB 朋友的朋友查询是多少(带计数)

    我正在尝试使用 ArangoDB 获取朋友的朋友列表 不仅仅是一个基本的朋友的朋友列表 我还想知道用户和朋友的朋友有多少个共同的朋友并对结果进行排序 经过多次尝试 重新 编写性能最佳的 AQL 查询 我最终得到的是 LET friends
  • 为什么这段代码会破坏内存?

    这是一个相当新手的问题 应该很快就能回答 基本上 在第一次调用之后Printf in echo 内容args已损坏 在我看来 我错误地传递了指针 但不明白为什么 define MAX PRINT OUTPUT 4096 void Echo
  • 调用 GetSecretValue 操作时出现 AWS (ResourceNotFoundException):Secrets Manager 找不到指定的密钥

    使用机密 ARN 时出现 ResourceNotFoundException 尝试仅使用秘密名称获取秘密 不起作用 尝试使用 ARN 获取机密 不起作用 我已经检查了我所承担的角色的策略 据我所知 SM 是这样设置的 JSON 格式 sec
  • FileStream 响应显示 � 而不是拉丁字符

    请阅读整个问题 我有一个 C ASP NET MVC 中的应用程序 Ajax 调用返回 PDF 文件的函数FileStream有回应STREAM A 因此 它无法正确呈现文件 打开时该文件只是空白页面 其中没有任何文本 Filestream
  • 迁移到 tomcat 7 后启动时出现 java.lang.IllegalArgumentException

    将 jbilling www jbilling org 移至 tomcat 7 后 它不再启动并在启动时抛出以下异常 java lang IllegalArgumentException taglib definition not cons
  • Jquery 中的文本突出显示与音频同步

    我需要同步许多网页上的文本和音频 播放音频时 文本应逐短语突出显示 而不是逐字或逐字符突出显示 因此仅在短语开头才需要同步 我不想使用仅 Flash 的解决方案 而更愿意使用对 HTML 更友好的解决方案 我想结合使用两个插件 JPlaye
  • 单行for循环构建字典?

    我正在构建一个字典 稍后我会将其转换为 JSON 字符串 我这样构造它 data for smallItem in bigList data smallItem smallItem 我怎样才能使 for 循环第一行 您可以使用听写理解 ht
  • Maven中如何处理生成源的依赖关系?

    在过去的几天里 我一直在尝试使用以下命令将 REST API 客户端的代码生成到我的项目中 openapi generator maven plugin 然而 Maven 失败了compile 一旦意识到生成的代码刚刚引入的第三方依赖项尚未
  • 使 zsh 从文件中获取完整参数

    zsh很棒 但它的完成系统非常多样化 并且文档缺乏好的示例 是否有用于完成特定应用程序的模板 补全将从文件中获取其匹配数据 并用换行符分隔 我尝试修改我的一个旧示例 该示例将匹配数据 实时 cat zsh completers jazzup
  • Java8 - 显式类型如何匹配一种变体 - 而不是其他类型?

    我有一个简单的片段如下 我提到this https jira mongodb org browse JAVA 2010 List
  • 使用 Javascript / Jquery 滚动到页面上的特定位置[重复]

    这个问题在这里已经有答案了 可以使用以下命令移动到页面上的某个位置 elementId 我怎样才能使用 Javascript Jquery 做同样的事情 当调用 JS 函数时 我想滚动到该页面上的特定位置 经过多次谷歌搜索后 我发现你只需要
  • ruby: `read': File.read 处的参数无效 -(Errno::EINVAL)

    我正在做一个简单的脚本来检查所有文件的 crc require zlib exit if Object const defined Ocra files Dir glob File open dir txt a do file file p
  • 了解触摸事件

    我正在尝试让我的一些库与触摸设备一起使用 但我很难弄清楚它们是如何支持的以及它们是如何工作的 基本上有5个触摸事件 https developer mozilla org en US docs DOM Touch events 但移动浏览器
  • C#中访问内存地址

    我正在与 ActiveX 组件交互 该组件为我提供内存地址和字节数 如何编写 C 程序来访问从给定内存地址开始的字节 有没有一种方法可以本地实现 或者我必须与 C 接口 ActiveX 组件和我的程序是否共享相同的内存 地址空间 您可以使用
  • THREE.BufferGeometry - 访问面索引和面法线

    在 BufferGeometry 中 有没有一种方法可以访问面索引和法线而不转换为几何图形 手头的几何体是由 Threejs 编辑器创建的 SphereBufferGeometry 我只需要读取面部索引和法线 而不需要修改它们 Buffer
  • Google 结账通知确认失败

    我有一个被调用的回调 url 我可以处理它 但是 Google 不会处理我的确认 这一切都在EnvironmentType Sandbox 在 Google 结帐 集成控制台 中 我收到以下消息 我们在处理您的通知确认时遇到错误 我们得到的
  • 使用 ItemTouchHelper 时,如何在拖动时取消对 RecyclerView 中项目的拖动?

    背景 我试图拥有一个具有不同视图类型的 RecyclerView 但具有拖放功能以及单击和长按操作的能力 它与 电话 应用程序类似 您可以在其中更改收藏夹项目的顺序 在 电话 应用程序上 当您长按某个项目时 会立即出现上下文菜单 如果继续拖
  • 配置器中的组合数量

    我被要求编写一个例程来决定产品配置器中可能的组合数量 配置器非常简单 尽管它具有比这更多的功能 但它可以建模为多个 单选组 如 UI 控件 其中必须选择 n 个选项之一 唯一可以使用的约束是规则 如果选择了一个选项 则不能选择另一个选项 所
  • Pandas 两个分组的 DataFrame 列的简单关联

    有没有一种好方法来获取两个分组的 DataFrame 列的简单关联 看来无论熊猫怎样 corr 函数想要返回一个相关矩阵 例如 i pd MultiIndex from product A B C np arange 1 11 1 name