数据帧分组的多个索引

2024-01-08

我将从示例开始，然后分解正在发生的事情。

这是一个示例输入：

数据框：

**Name**    **No.**      **Test**       ***Grade***
Bob        2123320        Math             Nan
Joe        2832883       English           90
John       2139300       Science           85
Bob        2123320        History          93
John       2234903        Math             99

希望输出：

**Name**         ********2139300*********     ********2234903*******
                  Math   English  Science     Math   English  Science 
  John            0       0         85        99        0          0

正如标题所示，我正在尝试应用多个索引。所以基本上它首先查找每个名称，然后对于找到的每个名称查看它有多少个不同的编号。在这种情况下，它将阈值设置为至少 2 个不同的数字（这就是为什么只输出 John 而 Joe/Bob 不输出的原因）。

现在，在每个不同的号码中。我想要搜索特定的测试子集，在本例中只有{数学、英语、科学}。对于每项测试，如果相关人员参加了该测试，则应该有一个等级。我希望为相关测试以及该人未参加的测试输出该成绩。我希望它输出某种简单的标记（即，如果该人当天只参加了数学，则英语和科学输出 0)。

因此，实际上，它首先根据不同号码的数量对人员进行索引，并将其分组。然后它按测试类型对它们进行索引（我只想要其中的一个子集）。它最终会根据每个人参加的测试类型分配一个值，而对于没有参加的测试则简单地输出 0。

这和我之前问的另一个问题类似：Python 中的分组特征矩阵#2-后续 https://stackoverflow.com/questions/49744958/grouped-feature-matrix-in-python-2-follow-up

除了现在我有另一列而不是 1 和 0 之外，其中包含我想要输出的实际值。

谢谢。

编辑：更多样本/输出

 **Name**    **No.**      **Test**       ***Grade***
Bob        2123320        Math             Nan
Joe        2832883       English           90
John       2139300       Science           85
Bob        2123320        History          93
John       2234903        Math             99
Bob        2932848         English         99


  **Name**    2139300        2234903       2123320      2932848
          M   E    S      M   E    S    M   E    S    M   E    S
  John    0   0    85    99   0    0   Nan  Nan  Nan  Nan  Nan Nan
  Bob     Nan Nan  Nan   Nan  nan  Nan 86   0    0    0    99  0

让我们使用：

将数据框过滤为仅包含您关心的记录

df_out = df[df.groupby(['Name'])['No.'].transform(lambda x: x.nunique() > 1)]

现在，重塑数据框set_index, unstack, and reindex:

df_out.set_index(['Name','No.','Test'])['Grade'].sum(level=[0,1,2])\
      .unstack(-1, fill_value=0)\
      .reindex(['Math','English','Science'], axis=1, fill_value=0)\
      .unstack(-1, fill_value=0).swaplevel(0, 1, axis=1)\
      .sort_index(1)

Output:

No.  2123320              2139300              2234903              2932848             
Test English Math Science English Math Science English Math Science English Math Science
Name                                                                                    
Bob        0    0       0       0    0       0       0    0       0      99    0       0
John       0    0       0       0    0      85       0   99       0       0    0       0

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

数据帧分组的多个索引的相关文章

使用 matplotlib 绘制时间序列数据并仅在年初显示年份

rcParams date autoformatter month b n Y 我正在使用 matpltolib 来绘制时间序列如果我按上述方式设置 rcParams 则生成的图会在每个刻度处标记月份名称和年份我怎样才能将其设置为仅在每
Python - StatsModels、OLS 置信区间

在 Statsmodels 中我可以使用以下方法拟合我的模型 import statsmodels api as sm X np array 22000 13400 47600 7400 12000 32000 28000 31000 6
如何使用Conda下载python包并随后离线安装？

我知道通过 pip 我可以使用以下命令下载 Python 包但 pip install 破坏了我的内部包依赖关系当我做 pip download
无法使用 VBA 代码从 Excel 连接到 Teradata - 无法通过网络访问 Teradata 服务器

我一直在尝试使用 vba 代码从 Excel 连接到 Teradata 但收到以下错误无法通过网络访问 Teradata Server 我已经能够从 Teradata SQL 助手成功连接并且还成功 ping 通 Teradata 服务
使用 VBScript 在日期字段值上选择错误的数据

我有一张包含以下数据的表现在 Excel 共有 36 个任务每个任务有 4 列第一个任务即 Task1 名称将始终从 L 列开始 144 列描述了 36 个任务现在我们需要按行进行检查并需要检查 TNStart 开始日期你们能
OpenCV 无法从 MacBook Pro iSight 捕获

几天后我无法再从 opencv 应用程序内部打开我的 iSight 相机 cap cv2 VideoCapture 0 返回并且cap isOpened 回报true 然而 cap grab 刚刚返回false 有任何想法吗示例代码
如何加速Python中的N维区间树？

考虑以下问题给定一组n间隔和一组m浮点数对于每个浮点数确定包含该浮点数的区间子集这个问题已经通过构建一个解决区间树 https en wikipedia org wiki Interval tree 或称为范围树或线段树已经针对一
如何在Python中获取葡萄牙语字符？

我正在研究葡萄牙语角色看起来很奇怪我怎样才能解决这个问题代码 import feedparser import random Vou definir os feeds feeds conf feedurl http pplware s
BeautifulSoup 中的嵌套标签 - Python

我在网站和 stackoverflow 上查看了许多示例但找不到解决我的问题的通用解决方案我正在处理一个非常混乱的网站我想抓取一些数据标记看起来像这样 table tbody tr tr tr td td td table tr t
添加不同形状的 numpy 数组

我想添加两个不同形状的 numpy 数组但不进行广播而是将缺失值视为零可能最简单的例子是 1 2 3 2 gt 3 2 3 or 1 2 3 2 1 gt 3 2 3 1 0 0 我事先不知道形状我正在弄乱每个 np shape
在Python中获取文件描述符的位置

比如说我有一个原始数字文件描述符我需要根据它获取文件中的当前位置 import os psutil some code that works with file lp lib open path to file p psutil Pro
在f字符串中转义字符[重复]

这个问题在这里已经有答案了我遇到了以下问题f string gt gt gt a hello how to print hello gt gt gt f a a gt gt gt f a File
Fabric env.roledefs 未按预期运行

On the 面料网站 http docs fabfile org en 1 10 usage execution html 给出这个例子 from fabric api import env env roledefs web hosts
如何在 Python 中追加到 JSON 文件？

我有一个 JSON 文件其中包含 67790 1 kwh 319 4 现在我创建一个字典a dict我需要将其附加到 JSON 文件中我尝试了这段代码 with open DATA FILENAME a as f json obj js
为字典中的一个键附加多个值[重复]

这个问题在这里已经有答案了我是 python 新手我有每年的年份和值列表我想要做的是检查字典中是否已存在该年份如果存在则将该值附加到特定键的值列表中例如我有一个年份列表并且每年都有一个值 2010 2 2009 4 1989
解释 Python 中的数字范围

在 Pylons Web 应用程序中我需要获取一个字符串例如关于如何做到这一点有什么建议吗我是 Python 新手我还没有找到任何可以帮助解决此类问题的东西该列表将是 1 2 3 45 46 48 49 50 51 77 使用
有没有办法检测正在运行的代码是否正在上下文管理器内执行？

正如标题所述有没有办法做到这样的事情 def call back if called inside context print running in context else print called outside context 这将
如何计算 pandas 数据帧上的连续有序值

我试图从给定的数据帧中获取连续 0 值的最大计数其中包含来自 pandas 数据帧的 id date value 列如下所示 id date value 354 2019 03 01 0 354 2019 03 02 0 354 201
在 Qt 中自动调整标签文本大小 - 奇怪的行为

在 Qt 中我有一个复合小部件它由排列在 QBoxLayouts 内的多个 QLabels 组成当小部件调整大小时我希望标签文本缩放以填充标签区域并且我已经在 resizeEvent 中实现了文本大小的调整这可行但似乎发生了某
从列表指向字典变量

假设你有一个清单 a 3 4 1 我想用这些信息来指向字典 b 3 4 1 现在我需要的是一个常规看到该值后在 b 的位置内读写一个值我不喜欢复制变量我想直接改变变量b的内容假设b是一个嵌套字典你可以这样做 reduce di

随机推荐

在 JetBrains PyCharm 中禁用 SQL 检测

我试图输入以下行 self label QtGui QLabel Select parameter from selected category PyCharm 认为我正在执行 SQL 查询或其他操作并给出了有关未配置数据连接的错误字符
（非原子、强）属性的生命周期在 iOS 中如何运作？

假设我有一个属性声明为 property nonatomic strong NSArray menuArr OR property strong NSArray menuArr 并将此属性设置为viewDidLoad 设备会记住我存储在
iOS 版 Meteor 1.3+ 帐户 Facebook 登录无法正常工作

我一直在尝试找到一个解决方案遗憾的是现在已经 3 个月了在 iOS 上使用 Meteors Accounts Facebook 登录 Facebook 我几乎尝试了 Google 搜索所能找到的所有内容接触了 Meteor 论坛甚至
数组指针的大小

如果我有一个这样声明的数组 int a 3 2 那么为什么是 sizeof a 0 8 whereas sizeof a 24 我不明白向指针添加 0 如何改变sizeof输出是否可能有一些隐式类型转换如果你添加0 to a then
如何让我的应用程序运行时间超过 10 分钟。在后台？

我知道在iOS中后台应用程序只能运行有限长度任务 10 分钟位置更新 VoIP Audio 有没有办法让我的应用程序避免在 10 分钟后被终止在后台我不会将我的应用程序提交到应用程序商店因此一切都是允许的私有框架即使我不需要
Vue&TypeScript：在项目目录之外的 TypeScript 组件中实现导入时如何避免错误 TS2345？

当尝试使用侧面组件在项目目录之外时我遇到了以下 TypeScript 错误 TS2345 Argument of type template string components SimpleCheckbox typeof Simple
从 Sonarqube 导出编码规则列表

我正在尝试找到一种方法来获取所有 Sonarqube Java 或其他规则带有键描述等的列表并将其导出为 Excel csv 或 xml 我可以动态地列出它们例如this http nemo sonarqube org co
如何检测用户取消请求

我正在通过编写一个非常基本的 http web 缓存代理来尝试 Node js 并且遇到了一些我尚未突破的问题假设我有一个非常基本的代理功能侦听请求将其传送到外部服务器等待响应将其传送回客户端我如何检测客户端 Web 浏览器何
使用 FileSystemXmlApplicationContext 编译 Spring 应用程序时出现 NoSuchMethodError

当运行一个非常基本的 Spring 应用程序并使用以下命令创建 Bean Factory 时文件系统Xml应用程序上下文我遇到一个无此类方法错误 The beans xml文件位于应用程序的根目录下的 pom xml 中如下所示
简单英语的递归函数[重复]

这个问题在这里已经有答案了可能的重复理解递归 https stackoverflow com questions 717725 understanding recursion 谁能用简单的英语向我解释一下递归函数实际上是做什么的如果能
将属性添加到使用 Knockout JS 映射插件创建的视图模型

我正在研究 Knockoutjs 网站上的映射插件示例这是示例数据 Knockout JS 映射插件 http knockoutjs com documentation plugins mapping html var data name
Angular2 中 Angular.equals 的等价物

我正在致力于将 Angular 1 项目迁移到 Angular 2 在 Angular 1 项目中我使用 Angular equals 进行对象比较angular equals ctrl obj1 ctrl newObj 我在网上搜索了
带有块完成处理程序的自定义模态窗口

我被困住了我正在尝试创建一个自定义模式对话框我希望它的执行方式与 NSSavePanel 类似使用块作为完成处理程序我只复制了我认为需要的重要片段 implementation ModalWindowController void
为什么 Python 显示“ValueError：无法将字符串转换为浮点数”？

我有一个包含数字的 CSV 文件我正在尝试将其转换为浮点数 filename filename csv enclosed folder path to Folder full path os path join enclosed fold
我们如何在android运行时从assets文件夹中删除文件？

我们如何在运行时从资产文件夹中删除文件有可能吗这是关于它的讨论 http www mail archive com 电子邮件受保护 msg16172 html http www mail archive com android deve
合并两个数组并保留重复值

有没有一个php函数可以合并2个数组并保留重复项 Like a array a b c b array b c b array merge2 a b result array a b c b c b thanks add1 什么我之前测试
如何在powershell中获取进程的内存（私有工作集）？

在任务管理器中我们可以看到内存私有工作集我的问题是如何在powershell中获取进程的内存私有工作集看图片 https i stack imgur com JQInb jpg https i stack imgur com JQI
如何将 Angular Material 扩展面板箭头图标放置在左侧

我已在我的应用程序中将 Angular Material 升级到 4 0 我正在使用
OWL 和 DL 推理：为什么爱欲不美丽？

我创建了一个基于以下内容的本体 Every person is beautiful if one of his her parents is beautiful Aphrodite is a parent of Eros Aphrodite
数据帧分组的多个索引

我将从示例开始然后分解正在发生的事情这是一个示例输入数据框 Name No Test Grade Bob 2123320 Math Nan Joe 2832883 English 90 John 2139300 Science 85

数据帧分组的多个索引

数据帧分组的多个索引 的相关文章

随机推荐

热门标签

数据帧分组的多个索引的相关文章