Python pandas - 在groupby之后过滤行

2023-11-29

例如，我有下表：

index,A,B
0,0,0
1,0,8
2,0,8
3,1,5
4,1,3

分组后按A:

0:
index,A,B
0,0,0
1,0,8
2,0,8

1:
index,A,B
3,1,5
4,1,3

我需要的是从每个组中删除行，其中列中的数字B小于组列中所有行的最大值B。好吧，我在将这个问题翻译和表述为英语时遇到问题，所以这里是示例：

列中行的最大值B在团体中0: 8

所以我想删除带有索引的行0并保留带有索引的行1 and 2

列中行的最大值B在团体中1: 5

所以我想删除带有索引的行4并保留带有索引的行3

我尝试使用 pandas 过滤功能，但问题是它同时对组中的所有行进行操作：

data = <example table>
grouped = data.groupby("A")
filtered = grouped.filter(lambda x: x["B"] == x["B"].max())

所以我理想需要的是一些过滤器，它迭代组中的所有行。

感谢帮助！

附：还有没有办法只删除组中的行而不返回DataFrame object?

你只需要使用apply on the groupby目的。我修改了您的示例数据以使这一点更清楚：

import pandas
from io import StringIO

csv = StringIO("""index,A,B
0,1,0.0
1,1,3.0
2,1,6.0
3,2,0.0
4,2,5.0
5,2,7.0""")

df = pandas.read_csv(csv, index_col='index')
groups = df.groupby(by=['A'])
print(groups.apply(lambda g: g[g['B'] == g['B'].max()]))

哪个打印：

         A  B
A index      
1 2      1  6
2 4      2  7

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

filter

Lambda

groupby

Python pandas - 在groupby之后过滤行的相关文章

Python 遍历目录树的方法是什么？

我觉得分配文件和文件夹并执行 item 部分有点黑客有什么建议么我正在使用Python 3 2 from os import from os path import def dir contents path contents list
Python 中的安全解除引用

Groovy 有一个很好的安全取消引用运算符这有助于避免 NullPointerExceptions variable method The method仅当以下情况时才会被调用variable is not null 有没有办法在 Py
Python sqlite3游标没有属性commit

当我运行这段代码时 path Scripts wallpapers single png conn sqlite3 connect Users Heaven Library Application Support Dock desktopp
为什么导入 pdb 时出现此错误？ “模块”对象没有属性“ascii_letters”

尝试调试我的代码我正在导入库pdb import sys from subprocess import check call import pdb functions if name main Code 我收到此错误 File reg p
html 解析器 python

我正在尝试解析一个网站我正在使用 HTMLParser 模块问题是我想解析第一个 a href 评论后但我真的不知道该怎么做所以我在文档中发现有一个函数叫做handle comment 但我还没有找到如何正确使用它我有以下内容 i
字典中的列表，Python 中的循环

我有以下代码 TYPES hotmail type hotmail lookup mixed dkim no signatures S Return Path email protected cdn cgi l email protecti
如何使用循环将十进制转换为二进制？

我想编写一个程序将十进制数 0 到 9 转换为二进制数我可以编写如何使用重复除法将十进制数转换为二进制数的代码但是我在创建一个以二进制格式打印十进制数字 0 到 9 的循环时遇到了麻烦这是我的代码 number 0 remaind
如何从 Python 中指定运行程序的输入文件？

我正在编写一个外部脚本以通过笔记本电脑上的 Python mrjob 模块而不是在 Amazon Elastic Compute Cloud 或任何大型集群上运行 mapreduce 作业我读自mrjob文档 http packag
在Python中删除带有重音符号的字符串中的所有非字母字符

我正在尝试使用 Python 3 7 从包含重音符号的字符串中删除所有非字母字符空格除外我尝试了以下方法 import re text 29 1981 4 2008 clean text re sub W d text print cl
在 matplotlib 中使用 yscale('log') 时缺少误差线

在某些情况下当使用对数刻度时 matplotlib 会错误地显示带有误差条的图假设这些数据例如在 pylab 内 s 19 0 20 0 21 0 22 0 24 0 v 36 5 66 814250000000001 130 177
pip 安装软件包两次

不幸的是我无法重现它但我们已经见过几次了 pip 将一个软件包安装两次如果卸载第一个第二个就会可见并且也可以被卸载我的问题如果一个包安装了两次如何用 python 检查背景我想编写一个测试来检查这一点 devOp Updat
一起使用 Flask 和 Tornado？

我是以下的忠实粉丝Flask 部分是因为它很简单部分是因为它有很多扩展 http flask pocoo org extensions 然而 Flask 是为了在 WSGI 环境中使用而设计的而 WSGI 不是非阻塞的所以我相信它
如何在 Python 中从 HTML 页面中提取 URL [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我必须用Python 编写一个网络爬
numpy.cov() 返回意外的输出

我有一个 X 数据集有 9 个特征和 683 行 683x9 我想获取这个 X 数据集和另一个与 X 具有相同形状的数据集的协方差矩阵我使用np cov originalData generatedData rowvar False 代
如何在C++中列出Python模块的所有函数名称？

我有一个 C 程序我想导入一个 Python 模块并列出该模块中的所有函数名称我该怎么做我使用以下代码从模块中获取字典 PyDictObject pDict PyDictObject PyModule GetDict pModule
使用Beam IO ReadFromPubSub模块时，可以在Python中提取带有属性的消息吗？尚不清楚是否支持

尝试将具有存储在 PubSub 中的属性的消息拉取到 Beam 管道中我想知道是否添加了对 Python 的支持这就是我无法阅读它们的原因我看到它存在于Java中 pipeline options PipelineOptions pi
Spyder 如何在同一线程的后台运行 asyncio 事件循环（或者确实如此？）

我已经研究 asyncio 模块功能几天了因为我想将它用于我的应用程序的 IO 绑定部分并且我认为我现在对它的工作原理有一个合理的理解或者在至少我认为我已经理解了以下内容任一时刻任一线程中只能运行一个异步事件循环一旦一切都设置
为什么 bot.get_channel() 会产生 NoneType？

我正在制作一个 Discord 机器人来处理公告命令当使用该命令时我希望机器人在特定通道中发送一条消息并向用户发送一条消息以表明该命令已发送但是我无法将消息发送到频道我尝试了这段代码 import discord import
从另一个 python 脚本获取返回信息

我在 Linux 上我有一个 python 脚本我想从另一个 python 脚本调用它我不想将其作为模块导入为了一层安全性现在为了学术练习因为我想弄清楚这一点我实际上想让一个脚本使用 os system 或另一个类似的函数并
从数据集的给定日期范围中提取属于一天的数据

我有一个数据集日期范围为 2018 年 1 月 12 日到 8 月 3 日其中包含一些值维数为my df数据框是 my df shape 9752 2 每行包含半小时频率第一行开始于2018 01 12 my df iloc 0 D

随机推荐

客户端 Javascript 中的 Base64 编码和解码 [重复]

这个问题在这里已经有答案了 JavaScript 中是否有任何方法可用于使用 Base64 编码对字符串进行编码和解码某些浏览器例如 Firefox Chrome Safari Opera 和 IE10 可以原生处理 Base64 看看
C++ 继承类中函数重载的问题

这可能是一个菜鸟问题对此感到抱歉最近当我尝试处理 C 中的一些高级内容函数重载和继承时我遇到了一个奇怪的问题我将展示一个简单的例子只是为了演示这个问题有两个班级 classA and classB 如下 class clas
Scala 中的斑马拼图

我正在尝试使用 Scala 完成 Udacity 的 CS212 但在使用 Zebra Puzzle 时遇到了问题 Python 中的一些概念并不容易转换为 Scala 尤其是对于像我这样的初学者这些是我迄今为止管理的代码 val hou
告诉 LESS 在某些特殊情况下不要惊慌并忽略奇怪的字符

我们的服务器有一个用于 CSS 文件的自定义语言切换器它识别某些模式和开关left right命令除其他外为了告诉它切换到哪里我们使用 RIGHT and LEFT 任何需要的地方 div somecls margin RIGHT
地图视图始终以我的位置为中心显示地图

当用户按下按钮时我使用以下代码来获取我的位置 mapview setShowsUserLocation YES 然后执行以下操作将地图置于用户位置的中心 void mapView MKMapView mapView didUpdateUs
从文件部分填充数组

我需要用文件中的数据部分填充 2 个数组并保持它们并行但我当前的代码给了我看起来像乱码的错误如果有人甚至可以帮助我解码错误我将非常感激 Code Author Sam LaManna Course CSC 135 Lisa Frye
java.lang.NoSuchMethodException: [类 android.view.View] FirebaseRecyclerAdapter

我正在尝试使用 FirebaseRecyclerAdapter 制作示例应用程序但不断收到错误java lang RuntimeException java lang NoSuchMethodException
C# - WCF - 进程间通信

用于进程间通信的最佳 WCF 绑定是什么我已经在本地网络上使用了 WCF 它非常棒我也想将它用于进程间通信然而我不想暴露网络上的通信 Use the 网络命名管道绑定用于同一台机器上的进程间通信使用NetTcp绑定如果您跨越机器边
glutTimerFunc 问题

我正在使用计时器函数来制作动画但是当我将其放置在 Renderer 类中时遇到问题 void Renderer animate int value glutTimerFunc TIMERMSECS animate 0 错误 rendere
如何在块循环中使用 PHPExcel 库确定文件结尾？

使用 PHPExcel 库我尝试迭代大约 1500 行每行大约有 25 列我正在使用这段代码取自PHPExcel 运行内存为 256 512 和 1024MB Create a new Reader of the type defi
Eclipse：以编程方式创建首选项页面

我正在尝试以编程方式创建首选项页面我需要使用首选项页面而不在plugin xml 中定义首选项页面扩展点我非常接近解决方案我能够加载页面并在应用程序第一次加载时保存值我的代码的核心是 PreferenceManager pmngr
使用 VBA 创建具有不同计数的数据透视表

我正在尝试使用 Excel 2013 VBA 创建一个数据透视表并将 DISTINCT COUNT 作为值字段我知道如果您手动创建数据透视表则必须选中将此数据添加到数据模型复选框以便为值数据透视字段提供不同的计数选项但我不知
Laravel 5.8：Homestead 重启后尚未设置门面根

所以我正在尝试进入 Laravel 这是我第一次使用 Vagrant 所以这是我的问题我已经通过Laravel 家园介绍并设置我的开发框一切似乎都正常工作我确实看到了 Laravel 默认应用程序当结束这一天时我已经停止了本地流浪
仅初始化部分功能一次

我有一个很小的函数我想初始化一次例如 void SomeFunc static bool DoInit true if DoInit CallSomeInitCode DoInit false The rest of the funct
无法更改模型生成器选项

我试图让 symfony 使用一个名为的自定义类jsDoctrineRecord代替sfDoctrineRecord对于它的模型这是重写类的代码
C# 中调整系统图标大小

我想用SystemIcons Warning但它对于我的需要来说太大了我想调整它的大小我努力了 Icon sizedIcon new Icon SystemIcons Warning new Size 10 10 但它不起作用图标保持
将图像 src 数据：转换为 Uint8Array

我想使用异食癖图书馆用于调整图像大小但它要求我提供一个 Uint8Array 并且我只有一个带有 src data image jpeg base64 9j 4AAQ 我不知道如何将其变成 Uint8Array 有什么想法吗 Than
防止将 master 中的文件与 Git 合并

In 另一个问题建议使用 gitattributes为了保持文件跟踪但不合并到不同的分支中但我下面的用例似乎不起作用 mkdir git cd git git init echo B gt b txt git add b txt git
HTML5：其他标签内有效标签的参考

不久前我正在使用w3c 验证器对于 HTML5 我正在尝试用一个标签来替换已弃用的
Python pandas - 在groupby之后过滤行

例如我有下表 index A B 0 0 0 1 0 8 2 0 8 3 1 5 4 1 3 分组后按A 0 index A B 0 0 0 1 0 8 2 0 8 1 index A B 3 1 5 4 1 3 我需要的是从每个组中删除

Python pandas - 在groupby之后过滤行

Python pandas - 在groupby之后过滤行 的相关文章

随机推荐

热门标签

Python pandas - 在groupby之后过滤行的相关文章