Pandas：选择每组中的前几行

2024-01-11

我无法解决这个简单的问题，我在这里寻求帮助...... 我的 DataFrame 如下，我想选择每组“a”中的前两行

df = pd.DataFrame({'a':pd.Series(['NewYork','NewYork','NewYork','Washington','Washington','Texas','Texas','Texas','Texas']), 'b': np.arange(9)})

df
Out[152]: 
            a  b
0     NewYork  0
1     NewYork  1
2     NewYork  2
3  Washington  3
4  Washington  4
5       Texas  5
6       Texas  6
7       Texas  7
8       Texas  8

也就是说，我想要如下输出：

            a  b
0     NewYork  0
1     NewYork  1
2  Washington  3
3  Washington  4
4       Texas  5
5       Texas  6

非常感谢您的帮助。

在 pandas 0.13rc 中，您可以直接使用 head 来执行此操作（即无需重置索引）：

In [11]: df.groupby('id', as_index=False).head(2)
Out[11]: 
    id   value
0    1   first
1    1  second
3    2   first
4    2  second
5    3   first
6    3   third
9    4  second
10   4   fifth
11   5   first
12   6   first
13   6  second
15   7  fourth
16   7   fifth

[13 rows x 2 columns]

注意：正确的索引，即使使用这个小例子，这也比以前（有或没有reset_index）要快得多：

# 0.13rc
In [21]: %timeit df.groupby('id', as_index=False).head(2)
1000 loops, best of 3: 279 µs per loop

# 0.12
In [21]: %timeit df.groupby('id', as_index=False).head(2)  # this didn't work correctly
1000 loops, best of 3: 1.76 ms per loop

In [22]: %timeit df.groupby('id').head(2).reset_index(drop=True)
1000 loops, best of 3: 1.82 ms per loop

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

Pandas：选择每组中的前几行的相关文章

将数据从 python pandas 数据框导出或写入 MS Access 表

我正在尝试将数据从 python pandas 数据框导出到现有的 MS Access 表我想用已更新的数据替换 MS Access 表在 python 中我尝试使用 pandas to sql 但收到错误消息我觉得很奇怪使用 p
使用带有关键字参数的 map() 函数

这是我尝试使用的循环map功能于 volume ids 1 2 3 4 5 ip 172 12 13 122 for volume id in volume ids my function volume id ip ip 我有办法做到这一点
如何使用Conda下载python包并随后离线安装？

我知道通过 pip 我可以使用以下命令下载 Python 包但 pip install 破坏了我的内部包依赖关系当我做 pip download
是否可以忽略一行的pyright检查？

我需要忽略一行的pyright 检查有什么特别的评论吗 def create slog group SLogGroup data Optional dict None SLog insert one SLog group group da
Python 函数可以从作用域之外赋予新属性吗？

我不知道你可以这样做 def tom print tom s locals locals def dick z print z name z name z guest Harry print z guest z guest print di
从 Flask 访问 Heroku 变量

我已经使用以下命令在 Heroku 配置中设置了数据库变量 heroku config add server xxx xxx xxx xxx heroku config add user userName heroku config add
如何在Python中获取葡萄牙语字符？

我正在研究葡萄牙语角色看起来很奇怪我怎样才能解决这个问题代码 import feedparser import random Vou definir os feeds feeds conf feedurl http pplware s
BeautifulSoup 中的嵌套标签 - Python

我在网站和 stackoverflow 上查看了许多示例但找不到解决我的问题的通用解决方案我正在处理一个非常混乱的网站我想抓取一些数据标记看起来像这样 table tbody tr tr tr td td td table tr t
在Python中获取文件描述符的位置

比如说我有一个原始数字文件描述符我需要根据它获取文件中的当前位置 import os psutil some code that works with file lp lib open path to file p psutil Pro
Pygame：有没有简单的方法可以找到按下的任何字母数字的字母/数字？

我目前正在开发的游戏需要让人们以自己的名义在高分板上计时我对如何处理按键有点熟悉但我只处理过寻找特定的按键有没有一种简单的方法可以按下任意键的字母而不必执行以下操作 for event in pygame event get if
如何在Python中对类别进行加权随机抽样

给定一个元组列表其中每个元组都包含一个概率和一个项目我想根据其概率对项目进行采样例如给出列表 3 a 4 b 3 c 我想在 40 的时间内对 b 进行采样在 python 中执行此操作的规范方法是什么我查看了 random 模
对年龄列进行分组/分类

我有一个数据框说df有一个柱子 Ages gt gt gt df Age 0 22 1 38 2 26 3 35 4 35 5 1 6 54 我想对这个年龄段进行分组并创建一个像这样的新专栏 If age gt 0 age lt 2 the
解释 Python 中的数字范围

在 Pylons Web 应用程序中我需要获取一个字符串例如关于如何做到这一点有什么建议吗我是 Python 新手我还没有找到任何可以帮助解决此类问题的东西该列表将是 1 2 3 45 46 48 49 50 51 77 使用
类型错误：预期单个张量时的张量列表 - 将 const 与 tf.random_normal 一起使用时

我有以下 TensorFlow 代码 tf constant tf random normal time step batch size 1 1 我正进入状态TypeError List of Tensors when single Te
有人用过 Dabo 做过中型项目吗？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我们正处于一个新的 ERP 风格的客户端服务器应用程序的开始阶段该应用程序是作为 Python 富客户端开发的我们目前正在评估 Dabo
如何计算 pandas 数据帧上的连续有序值

我试图从给定的数据帧中获取连续 0 值的最大计数其中包含来自 pandas 数据帧的 id date value 列如下所示 id date value 354 2019 03 01 0 354 2019 03 02 0 354 201
识别 pandas 数据框中各组之间的差异

我有一个按日期和 ID 索引的 pandas 数据框我想识别日期之间增删的ID 将 ID 添加到另一个数据帧以及添加删除的日期 date ID value 12 31 2010 13 0 124409 9 0 555959 1 0 7
使用其构造函数初始化 OrderedDict 以便保留初始数据的顺序的正确方法？

初始化有序字典 OD 以使其保留初始数据的顺序的正确方法是什么 from collections import OrderedDict Obviously wrong because regular dict loses order d O
Scrapy：如何使用元在方法之间传递项目

我是 scrapy 和 python 的新手我试图将 parse quotes 中的项目 item author 传递给下一个解析方法 parse bio 我尝试了 request meta 和 response meta 方法如 sc
Python 类继承 - 诡异的动作

我观察到类继承有一个奇怪的效果对于我正在处理的项目我正在创建一个类来充当另一个模块的类的包装器我正在使用第 3 方 aeidon 模块用于操作字幕文件但问题可能不太具体以下是您通常如何使用该模块 project aeidon P

随机推荐

Airflow - 从 dag 上下文回调中解析任务 ID

起初与dag callback on failure callback and on success callback 我以为这会触发success or fail状态时dag完成如 dag 中所定义但随后它似乎每次都会被实例化task
Matplotlib 提供的seaborn 样式自 3.6 起已弃用

Matplotlib 提供的seaborn 样式自 3 6 起已弃用因为它们不再对应于seaborn 发布的样式但是它们仍将以 seaborn v0 8 rdquo 24418 24335 25552 20379 12290 2511
适用于 Android Studio 的 Google Play 服务版本

我正在从 Eclipse 切换到 Android Studio 在 Eclipse 中将 GPServices 添加到我的项目中非常简单只需确保在 SDK 管理器中安装了最新的 SDK 并将库从 SDK 包复制到我的工作区即可使用 AS
为每个左连接行匹配重复所有基表行

我无法简洁地描述我需要什么因此感谢任何编辑标题的帮助我有 3 张表 Jobs has JobID PK JobsDetail has JobID FK and DepartmentsID FK Departments has Depar
如何使用 dojo create 创建 div？

我想通过 dojo create 从此示例生成 divNodes0 div 包括 h1 和 ul div div style background color d0d0d0 h1 h1 ul ul div div
Kotlin 用子类型覆盖 fun

我在继承包含基类型的方法乐趣的接口时遇到问题我想将其重写为实现它的类中的子类型到目前为止我已经有了界面 interface IModel fun convert dataModel BaseDataModel 以及实现它的类 clas
如何使用命令行编译WPF程序？

我需要使用命令行 C 编译器即csc exe 问题是错误CS0103 编译器说没有InitializeComponent 我的程序中的方法但这是错误的因为我添加了 System Xaml dll 有人知道如何解决这个问题吗使用 MS
Rails Engine - Gems 依赖项，如何将它们加载到应用程序中？

我在这里做一个引擎它独立工作正常当我将其转换为 gem 并将其加载到另一个应用程序中时我收到许多未定义的错误这些错误来自我的引擎 gem 的依赖项这是宝石规格 s add dependency paperclip s add de
如何在引导程序中将图像放在图像上；

我需要将一个图像放在另一个图像上这是我的代码
找不到方法compile()

我想在 android studio 中添加一个 lib 但它不起作用这是一个屏幕截图我还尝试在 gradle build 中添加依赖项但这也不起作用也许是因为我在代理后面 You 使用错误 build gradle file 你不
基于 OWIN 在 MVC 5 中为多个 Web 应用程序设置表单身份验证

我正在设置我的第一个 MVC Web 应用程序我知道我需要提供基于表单的身份验证模型并且我也知道我也会将其重用于多个其他内部 Web 应用程序我相信 MVC 5 身份验证的所有文档都基于 OWIN 内容并且使用 EF Code Fi
如何更改 Windows 服务的名称？

我有一个用 C 开发的 Windows 服务应用程序相同的服务需要使用不同的配置文件来运行要在同一台计算机上运行这些服务我需要更改服务的名称我可以创建解决方案的多个副本但不确定如何更改服务的名称 Thanks 在您的 win 服务
在 Powershell 中创建表

伙计们我有一个查询远程计算机中的服务的脚本它运行 2 个嵌套的 foreach 循环其中 1 个用于计算机列表内部一个用于服务列表我想在二维数组中捕获该过程的输出 The desired output should be like
Node.js 猫鼬性能

有人有使用 mongoose js 作为大规模 Mongodb 的 Node js 映射器的经验吗我想知道是否应该使用本机驱动程序因此我将所有内容保持轻量级或编写一个简单的包装器如果有人有任何提示请建议非常感谢参加聚会有点晚了
如何订购字母列表（“a”、“b”、“c”、...、“z”、“aa”、“ab”）？在这种情况下，String#succ 和 <=> 似乎不能很好地协同工作

我的一个对象 item 有一个 ID letter id 格式为 a b aa ab 等为了生成它我使用 ruby 的String succ在这样的实例方法中 def set letter id last parent items al
日期之间的天数（不包括周末和节假日）

有没有办法在不创建新表或视图的情况下计算 PostgreSQL 中两个日期之间的天数不包括周末和特定假期我只有数据库的读取权限因此无法创建假日表或视图我正在考虑使用generate series函数但假期并不遵循特定的模式因
Junit 5 和 IntelliJ“未找到测试”

问答式问题因为现有问题与我在此处所做的简单拼写错误不符 Goal 使用 UI 通过 IntelliJ IDE 执行简单的 JUnit 测试右键单击运行测试 Problem IntelliJ 表示未找到测试 Code import o
Pygame 表面的 alpha 不影响透明度

当鼠标未悬停在游戏中时我试图使用户界面事物变得透明但由于某种原因当我设置图像的 alpha 值使其变得透明时什么也没有发生这是一些可复制该问题的可运行代码 import pygame WHITE 255 255 255 class
在 R studio 中逐行调试

有没有办法在R studio环境中逐行调试代码我知道有断点下一步继续等来调试但我正在寻找像 Visual Studio 中的那样的逐行调试选项谢谢对于像我这样习惯了其他 IDE 的 R Studio 新手 a 通过单击边框或按S
Pandas：选择每组中的前几行

我无法解决这个简单的问题我在这里寻求帮助我的 DataFrame 如下我想选择每组 a 中的前两行 df pd DataFrame a pd Series NewYork NewYork NewYork Washington Wash

Pandas：选择每组中的前几行

Pandas：选择每组中的前几行 的相关文章

随机推荐

热门标签

Pandas：选择每组中的前几行的相关文章