如何计算分类值（包括零出现）？

2024-05-19

我想按月计算代码数量。这是我的示例数据框。

        id    month  code
0     sally    0  s_A
1     sally    0    s_B
2     sally    0   s_C
3     sally    0   s_D
4     sally    0    s_E
5     sally    0   s_A
6     sally    0    s_A
7     sally    0   s_B
8     sally    0   s_C
9     sally    0   s_A

我使用 count() 转换为这个系列。

df.groupby(['id', 'code', 'month']).month.count()

id      code   month  count
sally  s_A      0    12
                1    10
                2     3
                7    15

但是，我想包括零出现，就像这样。

id      code   month  count
sally  s_A      0    12
                1    10
                2     3
                3    0
                4    0
                5    0
                6    0
                7    15
                8    0
                9    0
                10   0
                11   0

您可以使用reindex http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.reindex.html与新的Multindex已创建from_product http://pandas.pydata.org/pandas-docs/stable/generated/pandas.MultiIndex.from_product.html:

Notice:
大熊猫的大小和数量有什么区别？ https://stackoverflow.com/questions/33346591/what-is-the-difference-between-size-and-count-in-pandas

df = pd.DataFrame({
'month': [0, 0, 0, 0, 1, 1, 1, 2, 2, 7], 
'code': ['s_A', 's_A', 's_A', 's_A', 's_A', 's_A', 's_A', 's_B', 's_B', 's_B'], 
'id': ['sally1','sally1','sally1','sally','sally','sally','sally','sally','sally','sally']})

print (df)
  code      id  month
0  s_A  sally1      0
1  s_A  sally1      0
2  s_A  sally1      0
3  s_A   sally      0
4  s_A   sally      1
5  s_A   sally      1
6  s_A   sally      1
7  s_B   sally      2
8  s_B   sally      2
9  s_B   sally      7

df = df.groupby(['id', 'code', 'month']).size()
n = ['id','code','month']
mux = pd.MultiIndex.from_product([df.index.levels[0],df.index.levels[1], range(13)], names=n)
df = df.reindex(mux, fill_value=0)
print (df)
id      code  month
sally   s_A   0        1
              1        3
              2        0
              3        0
              4        0
              5        0
              6        0
              7        0
              8        0
              9        0
              10       0
              11       0
              12       0
        s_B   0        0
              1        0
              2        2
              3        0
...
...

旧的解决方案：

reindex with unstack http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.unstack.html and stack http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.stack.html，但随后需要一些数据清理：

df = df.groupby(['id', 'code', 'month']).size() \
       .to_frame('count') \
       .unstack([0,1], fill_value=0) \
       .reindex(range(13), fill_value=0) \
       .stack([1,2], dropna=False) \
       .fillna(0) \
       .astype(int) \
       .swaplevel(0,2) \
       .sort_index()
print (df)
                   count
code id     month       
s_A  sally  0          1
            1          3
            2          0
            3          0
            4          0
            5          0
            6          0
            7          0
            8          0
            9          0
            10         0
            11         0
            12         0
     sally1 0          3
            1          0
            2          0
            3          0
            4          0

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何计算分类值（包括零出现）？的相关文章

将 Matplotlib 误差线放置在不位于条形中心的位置

我正在 Matplotlib 中生成带有错误栏的堆积条形图不幸的是某些层相对较小且数据多样因此多个层的错误条可能重叠从而使它们难以或无法读取 Example 有没有办法设置每个误差条的位置即沿 x 轴移动它以便重叠的线显示在彼此
Python（Selenium）：如何通过登录重定向/组织登录登录网站

我不是专业程序员所以请原谅任何愚蠢的错误我正在做一些研究我正在尝试使用 Selenium 登录数据库来搜索大约 1000 个术语我有两个问题 1 重定向到组织登录页面后如何使用 Selenium 登录 2 如何检索数据库在我解决
Django：按钮链接

我是一名 Django 新手用户尝试创建一个按钮单击该按钮会链接到我网站中的另一个页面我尝试了一些不同的例子但似乎没有一个对我有用举个例子为什么这不起作用
是否可以忽略一行的pyright检查？

我需要忽略一行的pyright 检查有什么特别的评论吗 def create slog group SLogGroup data Optional dict None SLog insert one SLog group group da
基于代理的模拟：性能问题：Python vs NetLogo & Repast

我正在 Python 3 中复制一小段 Sugarscape 代理模拟模型我发现我的代码的性能比 NetLogo 慢约 3 倍这可能是我的代码的问题还是Python的固有限制显然这只是代码的一个片段但 Python 却花费了三分
Spark KMeans 无法处理大数据吗？

KMeans 有几个参数training http spark apache org docs latest api python pyspark mllib html highlight kmeans pyspark mllib clus
以编程方式停止Python脚本的执行？ [复制]

这个问题在这里已经有答案了是否可以使用命令在任意行停止执行 python 脚本 Like some code quit quit at this point some more code that s not executed sys e
OpenCV 无法从 MacBook Pro iSight 捕获

几天后我无法再从 opencv 应用程序内部打开我的 iSight 相机 cap cv2 VideoCapture 0 返回并且cap isOpened 回报true 然而 cap grab 刚刚返回false 有任何想法吗示例代码
如何加速Python中的N维区间树？

考虑以下问题给定一组n间隔和一组m浮点数对于每个浮点数确定包含该浮点数的区间子集这个问题已经通过构建一个解决区间树 https en wikipedia org wiki Interval tree 或称为范围树或线段树已经针对一
如何使用 OpencV 从 Firebase 读取图像？

有没有使用 OpenCV 从 Firebase 读取图像的想法或者我必须先下载图片然后从本地文件夹执行 cv imread 功能有什么办法我可以使用cv imread link of picture from firebase 您可以
绘制方程

我正在尝试创建一个函数它将绘制我告诉它的任何公式 import numpy as np import matplotlib pyplot as plt def graph formula x range x np array x rang
添加不同形状的 numpy 数组

我想添加两个不同形状的 numpy 数组但不进行广播而是将缺失值视为零可能最简单的例子是 1 2 3 2 gt 3 2 3 or 1 2 3 2 1 gt 3 2 3 1 0 0 我事先不知道形状我正在弄乱每个 np shape
Python 的“zip”内置函数的 Ruby 等价物是什么？

Ruby 是否有与 Python 内置函数等效的东西zip功能如果不是做同样事情的简洁方法是什么一些背景信息当我试图找到一种干净的方法来进行涉及两个数组的检查时出现了这个问题如果我有zip 我可以写这样的东西 zip a b a
如何使用Python创建历史时间线

So I ve seen a few answers on here that helped a bit but my dataset is larger than the ones that have been answered prev
python获取上传/下载速度

我想在我的计算机上监控上传和下载速度一个名为 conky 的程序已经在 conky conf 中执行了以下操作 Connection quality alignr wireless link qual perc wlan0 downspe
类型错误：预期单个张量时的张量列表 - 将 const 与 tf.random_normal 一起使用时

我有以下 TensorFlow 代码 tf constant tf random normal time step batch size 1 1 我正进入状态TypeError List of Tensors when single Te
使用 Python 的 matplotlib 选择在屏幕上显示哪些图形以及将哪些图形保存到文件中

我想用Python创建不同的图形matplotlib pyplot 然后我想将其中一些保存到文件中而另一些则应使用show 命令然而 show 显示all创建的数字我可以通过调用来避免这种情况close 创建我不想在屏幕上显示的绘图
如何使用 Pycharm 安装 tkinter？ [复制]

这个问题在这里已经有答案了 I used sudo apt get install python3 6 tk而且效果很好如果我在终端中打开 python Tkinter 就可以工作但我无法将其安装在我的 Pycharm 项目上 pip
NotImplementedError：无法将符号张量 (lstm_2/strided_slice:0) 转换为 numpy 数组。时间

张量流版本 2 3 1 numpy 版本 1 20 在代码下面 define model model Sequential model add LSTM 50 activation relu input shape n steps n fe
Statsmodels.formula.api OLS不显示截距的统计值

我正在运行以下源代码 import statsmodels formula api as sm Add one column of ones for the intercept term X np append arr np ones 50

随机推荐

Python排序算法[重复]

这个问题在这里已经有答案了我在Python中实现了不同的排序算法以更好地理解它们我想知道Python的内置排序方法实现什么类型的排序这是一个叫做Timsort http en wikipedia org wiki Timsort由
以编程方式访问 Exchange 文件夹中的存档邮件

我试图通过 Outlook 2013 的 ActiveX 接口访问给定文件夹中的所有邮件我使用 Outlook 的消息 API MAPI 来获取所需的文件夹对象但是当我浏览此文件夹对象的所有项目时许多消息丢失了事实上 MS Exc
自定义帖子类型的 WordPress 自定义字段

过去有几个人出现过这个问题但他们的问题的解决方案对我来说不起作用我已经尝试了很多在 WordPress 中我创建了 3 种自定义帖子类型 1 代表视频新闻和音乐每个内容都发布到自己的页面我想添加自定义字段这样我就可以为
在哪里放置谷歌分析代码[重复]

这个问题在这里已经有答案了可能的重复谷歌分析在头或身体的末端 https stackoverflow com questions 3173571 google analytics at head or end of body 谷歌分析
如何使用 Razor 将事件添加到按钮？

我对 asp net core 开发很陌生我真的不太了解 javascript 我想知道是否有某种方法可以仅使用 C 处理 Html 输入的 OnClick 或 OnChange 这样的输入事件剃刀代码也没有表格 and 仅使用 Razo
Android - 保存动态更改布局的状态

我有一个布局用户可以在其中添加按钮并将其放置在他们想要的位置我想允许用户保存他们的布局以便下次打开应用程序时加载它有谁知道我是否可以将文件保存到 SD 卡上或者我可以使用某种layout getXml 方法并将其放入我的应用程序
如何在Electron WebView中连接到代理？

因为我可以通过连接到免费代理服务器或付费目前用作电子 JS 解决方案作为桌面应用程序代理列表服务器示例 http proxylist hidemyass com http proxylist hidemyass com 您可以使用 s
Pandas - 使用 .isnull()、notnull()、dropna() 删除丢失数据的行不起作用

这实在是太奇怪了我尝试了几种从 pandas 数据框中删除丢失数据的行的方法但它们似乎都不起作用这是代码我只是取消注释所使用的方法之一但这些是我在不同修改中使用的三种方法这是最新的 import pandas as pd Tes
我可以更改键盘方向吗？

例如我用这段代码关闭自动旋转 BOOL shouldAutorotateToInterfaceOrientation UIInterfaceOrientation interfaceOrientation return NO BOOL sh
Git 到 TFS 源代码管理迁移

我想看看 TFS 如何为我的命令工作所以我想将我们当前的 GIT 存储库移动到 TFS 数据库我们使用 GIT 来获得普遍的分支支持因此我想使用 TFS 2010 来解决该问题现在的问题是如何将 GIT 存储库导出到 TFS 显然
需要将smarty文件改为zend文件

你好我有 smarty 文件我需要转换成 zend 如何将 smarty 更改为 zend 它的 tpl 文件 div class form div
GNU make 的回溯

有没有办法让 GNU make 打印导致命令失败时执行的目标的回溯我经常处理严重混淆的 makefile 同时解决在新系统上构建软件的可移植性问题这对于 make 来说似乎是一件非常简单的事情这将极大地帮助调试但我找不到任何方法来
Firebase 管理 SDK Android

在 Android 中初始化 Firebase Admin SDK 的代码 Override protected void onCreate Bundle savedInstanceState super onCreate savedIns
Web API 和 OData - 传递多个参数

是否可以让 OData 执行以下操作我希望能够通过传递可能不是主键的参数来查询 REST 调用我可以调用 REST 方法吗比如 gt GetReports 22 2014 or Reports 22 2014 HttpGet ODat
使用 Simulator 时 Xcode 10 中的屏幕截图尺寸错误

我正在尝试使用 Xcode 10 模拟器为 iTunes 制作屏幕截图但图像大小错误我读过Debug gt Optimize Rendering for Window Scale会有帮助但在 Xcode 中没有这样的选项有人有这个问
html5 canvas 上的错误显示 lineWidth=1

I have example https developer mozilla org samples canvas tutorial 4 5 canvas linewidth html https developer mozilla org
我可以从命令行调用除 main(String[]) 之外的 java 方法吗？

我可以调用 java 方法吗 main String 从命令行如果没有 main 函数则可以添加一个 main 函数如果有则可以在顶部添加一系列 if then 块 public static void main String ar
从字体到跨度（大小和颜色）和背面的正则表达式（VB.NET）

我正在寻找一个正则表达式可以将我的字体标签仅具有大小和颜色属性转换为具有相关内联CSS的span标签如果有帮助的话这将在 VB NET 中完成我还需要一个正则表达式来实现相反的效果下面详细说明的是我正在寻找的转换示例 font
Flash ActionScript 2 的压缩和解压缩工具

您是否知道 flash actionscript 2 的任何 zip unzip 组件或脚本我知道这个图书馆 http ntt cc 2008 01 19 actionscript class library fzip html对于 Fl
如何计算分类值（包括零出现）？

我想按月计算代码数量这是我的示例数据框 id month code 0 sally 0 s A 1 sally 0 s B 2 sally 0 s C 3 sally 0 s D 4 sally 0 s E 5 sally 0 s A 6

如何计算分类值（包括零出现）？

如何计算分类值（包括零出现）？ 的相关文章

随机推荐

热门标签

如何计算分类值（包括零出现）？的相关文章