Pandas 多索引计数级别

2024-03-04

数据:

index = [('A', 'aa', 'aaa'),
         ('A', 'aa', 'aab'),
         ('B', 'bb', 'bbb'),
         ('B', 'bb', 'bbc'),
         ('C', 'cc', 'ccc')
        ]
values = [0.07, 0.04, 0.04, 0.06, 0.07]

s = pd.Series(data=values, index=pd.MultiIndex.from_tuples(index))

s
A  aa  aaa    0.07
       aab    0.04
B  bb  bbb    0.04
       bbc    0.06
C  cc  ccc    0.07

获得前两个级别的平均值很容易:

s.mean(level=[0,1])

Result:

A  aa    0.055
B  bb    0.050
C  cc    0.070

但要计算前两个级别的工作原理并不相同:

#s.count(level=[0,1]) # does not work

我可以通过以下方式解决:

s.reset_index().groupby(['level_0', 'level_1']).size()

level_0  level_1
A        aa         2
B        bb         2
C        cc         1

但必须有一种更干净的方法来获得相同的结果吗?我错过了一些明显的事情吗?


看起来有bug,你可以使用:

print (s.groupby(level=[0,1]).size())
#with exclude NaNs
#print (s.groupby(level=[0,1]).count())
A  aa    2
B  bb    2
C  cc    1
dtype: int64
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Pandas 多索引计数级别 的相关文章

  • 加快 pandas groupby 中的滚动总和计算

    我想按组计算大量组的滚动总和 但我很难快速地完成它 Pandas 内置了滚动和展开计算器的方法 这是一个例子 import pandas as pd import numpy as np obs per g 20 g 10000 obs g
  • Python 2.7 - statsmodels - 格式化和编写摘要输出

    我正在使用逻辑回归pandas 0 11 0 数据处理 和statsmodels 0 4 3在 Mac OSX Lion 上进行实际回归 我将运行约 2 900 个不同的逻辑回归模型 并需要将结果输出到 csv 文件并以特定方式格式化 目前
  • 在 pandas 线图中绘制多列[重复]

    这个问题在这里已经有答案了 我试图在折线图中绘制多个列 其中 月份 作为 X 轴 每个 计数 作为新线 我希望它有 5 行 Count 18 Count 14 我尝试绘制 1 条线作为测试 但是当我运行以下代码时 我得到以下输出 但没有图形
  • 使用 pandas 删除停用词

    我想从数据框的列中删除停用词 列内有需要拆分的文本 例如我的数据框如下所示 ID Text 1 eat launch with me 2 go outside have fun 我想应用停用词text column所以应该分开 我试过这个
  • Pandas groupby 汇总

    如果我有一个这样的数据框 import pandas as pd df pd DataFrame A 1 1 2 B a b c metric 4 5 2 df df groupby A B sum 得到的 df 为 metric A B
  • 将 pandas DataFrame 中的数字转换为特定字符串格式

    我需要运行一个可以通过循环完成的任务 但我想有一种更有效 更漂亮的方法来做到这一点 我有一个DataFrame它有一个整数列 我想将其转换为 4 位字符串表示形式 也就是说 3 应转换为 0003 234 应转换为 0234 我正在寻找一种
  • 如何计算pandas数据框中连续行之间的差异?

    我有一个数据框 df 具有三列 count a count b and date 计数为浮点数 日期为 2015 年的连续天数 我试图找出每天的计数之间的差异count a and count b列 意思是 我正在尝试计算这两列的每一行与前
  • ValueError:未知标签类型:“连续”

    我看过其他帖子讨论过这个问题 但其中任何一个都可以帮助我 我在 Windows x6 机器上使用带有 Python 3 6 0 的 jupyter 笔记本 我有一个很大的数据集 但我只保留其中的一部分来运行我的模型 这是我使用的一段代码 d
  • 如何在sklearn决策树中显示特征名称?

    我目前有一个决策树 将功能名称显示为X index i e X 0 X 1 X 2 etc from sklearn import tree from sklearn tree import DecisionTreeClassifier d
  • Pandas:如何根据另一个数据框的值对数据框上的列求和

    我是 Pandas 新手 我正在尝试做以下事情 我有一个名为的数据框comms包含articleID和commentScore列 等等 我有另一个名为arts带有列文章 ID 我需要创建arts一个名为文章评分 每篇文章必须具有articl
  • python 2.7模块pandas未安装“无法导入名称哈希表”

    我尝试在论坛 谷歌上寻找这个问题的答案 但我找不到任何东西 我的问题是这样的 来自 python 控制台 gt gt gt import pandas cannot import name hashtable Traceback most
  • 当时间为 00:00 时,Pandas 读取 excel 返回类型对象

    在更新版本的 Pandas 中 我使用的是 1 2 3 当从 Excel 文件读取时间时 时间为 00 00 00 时会出现问题 下面的脚本 其中 filepath 是我的 Excel 文件的路径 其中包含一个标题名为 Time 的列 im
  • pandas python 根据一个或多个其他列的子集更新 A 列的子集

    Edit我修改了下面的部分描述 以澄清 功能 和 组 的含义 修复拼写错误 并包含我尝试过的其他代码 我的熊猫df有 450 万行和 23 列 下表显示了几行df2这是从生成的df 它显示了两组 eeskin and hduquant 和三
  • Python 如何使用 ExcelWriter 写入现有工作表

    我正在尝试使用 ExcelWriter 将一些信息写入 添加到包含多个工作表的工作簿中 当我第一次使用该功能时 我正在使用一些数据创建工作簿 在第二次通话中 我想将一些信息添加到工作簿中不同位置的所有工作表中 def Out Excel f
  • 使用 python 在一个 html 页面中显示分割数据框的 HTML 代码

    我是 html css 新手 所以对以 html 格式显示的数据有疑问 我有一个很长的列表 我想将其拆分并以 html 格式显示为两个单独的列 例如 而不是 Col1 Col2 1 a 2 a 3 a 4 a 5 b 6 b 7 b 8 b
  • 如何使用固定的 pandas 数据框进行动态 matplotlib 绘图?

    我有一个名为的数据框benchmark returns and strategy returns 两者具有相同的时间跨度 我想找到一种方法以漂亮的动画风格绘制数据点 以便它显示逐渐加载的所有点 我知道有一个matplotlib animat
  • 在 MongoDB 聚合的“addField”操作中使用“$count”

    我正在尝试找到聚合运算符的正确组合 以将标题为 totalCount 的字段添加到我的 mongoDB 视图中 这将为我提供聚合管道特定阶段的计数 并将其输出为每个文档的计数结果 count count 但最终我得到了一个具有此结果的文档
  • Pandas Dataframe 中 bool 值的条件前向填充

    问题 如何转发 fill boolTruepandas 数据框中的值 如果是当天的第一个条目 True 到一天结束时 请参阅以下示例和所需的输出 Data import pandas as pd import numpy as np df
  • Geopandas 设置几何图形:MultiPolygon“等于 len 键和值”的 ValueError

    我有 2 个带有几何列的地理数据框 我将一些几何图形从 1 个复制到另一个 这对于多边形效果很好 但对于任何 有效 多多边形都会返回 ValueError 请指教如何解决这个问题 我不知道是否 如何 为什么应该更改 MultiPolygon
  • 使用基于正则表达式的部分匹配来选择 Pandas 数据帧的子数据帧

    我有一个 Pandas 数据框 它有两列 一列 进程参数 列 包含字符串 另一列 值 列 包含相应的浮点值 我需要过滤出部分匹配列 过程参数 中的一组键的子数据帧 并提取与这些键匹配的数据帧的两列 df pd DataFrame Proce

随机推荐

  • 比较和替换 SQL Server 中字符串中的字符

    我有一个字符串说 Hel 1 oO Input string Hel 1 oO 我想创建一个函数来解析字符串 Hel 1 oO 并将字母数字以外的所有字符替换为 基本上我想使用正则表达式作为 A Za z0 9 这样除了这些字符之外的所有字
  • 从 iOS 照片库中删除图像[重复]

    这个问题在这里已经有答案了 我创建了一个应用程序 它从手机的照片库中获取图像并将其显示在集合视图上 现在 我希望每当用户选择图像并单击删除按钮时 该特定图像就会从集合视图和图像库中删除 我正在使用 ALAssetLibrary 来获取图像
  • 为什么启动流式查询会导致“ExitCodeException exitCode=-1073741515”?

    一直在尝试适应新的结构化流媒体 但一旦我开始 它就会一直给我以下错误 writeStream query 知道是什么原因造成的吗 如果您在本地和 HDFS 之间拆分检查点和元数据文件夹 我能找到的最接近的是一个正在进行的 Spark 错误
  • 调用方法时出现参数数量错误

    我有课AClass和一个方法someMethod得到一个Object数组作为参数 public class AClass public void someMethod Object parameters 主要是 当我尝试在我创建的对象上调用
  • Pubnub 推送通知不适用于跨平台移动应用程序

    我们正在开发一个基于 cordova 的 Android 应用程序 它具有聊天功能 我们正在从服务器发送测试聊天消息 当应用程序位于前台时 我们收到的消息很好 我们希望当应用程序在后台时收到有关聊天消息的通知 但是我们没有收到任何有关聊天消
  • 找不到模块:无法解析“/vercel/path0/node_modules/cross-fetch/node_modules/node-fetch/lib”中的“编码”

    有没有人遇到过 npm 包带来的不间断警告问题 supabase supabase js The warning message warn node modules cross fetch node modules node fetch l
  • 使用 Timer 在 C# 中更新 UI

    我正在努力使我的应用程序从串行端口读取数据并更新 UI 上的仪表更加高效 我想就处理 UI 更改的代码寻求一些建议 我设置了一个计时器来检查发送到 COM 端口的数据 另一个计时器则使用从 COM 端口接收到的变量更新 UI 基本上发生的事
  • 使用 lucene 改进多线程索引

    我正在尝试使用多个线程在 Lucene 中构建索引 因此 我开始编码并编写了以下代码 首先 我找到文件 并为每个文件创建一个线程来索引它 之后 我加入线程并优化索引 它有效 但我不确定 我可以大规模信任它吗 有什么办法可以改善吗 impor
  • 为什么JAXB说“xxx是一个接口,而JAXB无法处理接口”。即使生成的类不是接口

    我使用 JAXB 绑定我的 xsd 然后尝试创建 JAXBContext JAXBContext jaxbContext JAXBContext newInstance my package name 但是 JAXB 给出了 180 Ill
  • React Native 应用程序在启动时在 Android 11 上崩溃,但没有给出错误

    this is my build gradle setting and this is my system info 我正在尝试在 android 11 上运行 React Native 应用程序 但它在启动时不断崩溃而没有给出任何错误我尝
  • GCC 的代码覆盖率选项如何工作?

    考虑以下命令 gcc fprofile arcs ftest coverage main c 它生成文件 main gcda gcov 将使用该文件来生成覆盖率分析 那么main gcda是如何生成的呢 仪器仪表是如何完成的 我可以看到检测
  • 如何利用foreman向暴发户导出?

    我正在尝试将我的应用程序导出到另一种流程管理格式 系统 具体来说 upstart http upstart ubuntu com 在这样做的过程中 我遇到了许多障碍 主要是由于缺乏文档 作为非 root 用户 我运行了以下命令 如图所示he
  • System.Json.DLL 在哪里?

    我试图遵循一些在 Http 客户端中使用 JSON 的示例 但它们引用了我找不到的 System Json DLL 看这个参考 http msdn microsoft com en us library system json jsonob
  • django - 一个模板中有 2 个视图

    我有两个不同的视图 它们从数据库获取过滤数据 我必须在一个模板文件 admin html 中使用这些视图 但我不能同时在一页上使用多个视图 这是我的观点1 draft list Post objects filter isdraft Tru
  • 调整字体大小以填充 UITextView?

    如何设置 UITextView 中文本的字体大小 使其填充整个 UITextView 我希望用户输入文本 然后让文本填充整个 UITextView 任何帮助表示赞赏 我已经转换了痴呆症的答案 https stackoverflow com
  • 在 Android 中创建手势

    你好 我正在关注这个教程 http www vogella de articles AndroidGestures article html http www vogella de articles AndroidGestures arti
  • 为什么 Codeception 为每个 test* 方法创建新的 \Test 实例?

    作为基础 我使用 Codeception TestCase Test 类 我注意到 对于类中定义的每个 test 方法 codeception 都会重新创建 TestCase Test 类 But Why 结果我不能使用类字段 public
  • contenteditable 选择文本不起作用

    我面临以下问题 当我尝试在 a 中选择文本时contenteditable元素并且选择的结束是元素内容的开始 那么不会触发 select 事件 并且没有Selection and Range对象 有人可以就为什么会发生这种情况或如何防止这种
  • 如何在 docker 镜像中配置 Let's 为 nginx 加密证书?

    我知道怎么做配置让我们为 nginx 加密 https www digitalocean com community tutorials how to secure nginx with let s encrypt on ubuntu 14
  • Pandas 多索引计数级别

    数据 index A aa aaa A aa aab B bb bbb B bb bbc C cc ccc values 0 07 0 04 0 04 0 06 0 07 s pd Series data values index pd M