Pandas 中的 Groupby、转置和追加？

2024-05-19

我有一个数据框，如下所示：

每个用户有10条记录。现在，我想创建一个如下所示的数据框：

userid  name1  name2  ... name10

这意味着我需要反转该列的每 10 条记录name并附加到新的数据框。

那么，它是如何做到的呢？有什么办法可以在 Pandas 中做到这一点吗？

groupby('userid') then reset_index在每个组内进行一致的跨组枚举。然后unstack获取列。

df.groupby('userid')['name'].apply(lambda df: df.reset_index(drop=True)).unstack()

示范

df = pd.DataFrame([
        [123, 'abc'],
        [123, 'abc'],
        [456, 'def'],
        [123, 'abc'],
        [123, 'abc'],
        [456, 'def'],
        [456, 'def'],
        [456, 'def'],
    ], columns=['userid', 'name'])

df.sort_values('userid').groupby('userid')['name'].apply(lambda df: df.reset_index(drop=True)).unstack()

如果你不想要userid作为索引，添加reset_index到最后。

df.sort_values('userid').groupby('userid')['name'].apply(lambda df: df.reset_index(drop=True)).unstack().reset_index()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python3x

pandas

groupby

pandasgroupby

Pandas 中的 Groupby、转置和追加？的相关文章

互补DNA序列

我在编写这个循环时遇到问题它似乎在第二个序列之后停止了我想返回给定 DNA 序列的互补 DNA 序列例如 AGATTC gt TCTAAG 其中 A T 和 C G def get complementary sequence dna
pandas 从 csv 文件读取 MultiIndex 数据

我有一个 MultiIndex csv 文件我想读入数据保存在csv文件中如下 import pandas as pd import numpy as np dfcsv pd read csv FilePath MultiIndex
在 x 轴上操作日期 Pandas Matplotlib

我有一组非常简单的数据如下所示我正在寻找一种方法来绘制此堆积条形图并格式化 x 轴日期使其从 1996 年 31 月 12 日开始到 2016 年 31 月 12 日结束增量为 365 天我编写的代码绘制了每个日期因此 x
如何使用 python 从嵌套表结构中识别最终父级？

我有下表我的问题是我如何以编程方式识别最终父级以下是通过示例解释的规则 the id 5 0的父母是51 0 身份证号51 0没有父母因此 id5 0的最终父级是51 0 the id 6 0的父母是1 0 身份证号1 0的父母是1
如何将 AWS Kinesis Video Stream GetMedia API 输出解码为 mp3/wav？

我现在使用 GetMedia API 通过 AWS Connect 服务将数据提取到 Kinesis Video Stream KVS 我能够提取Payload但如何将此输出转换为 mp3 wav 我想将此输出提取到 AWS Transcr
Pandas：向量化局部范围操作（[i:i+2] 行的最大值和总和）

我希望在数据帧中的每一行的局部范围内进行计算同时避免速度缓慢for环形例如对于下面数据中的每一行我想找到未来 3 天内包括当天的最高气温以及未来 3 天内的总降雨量 Day Temperature Rain 0 30 4 1 3
如何使用hbase协处理器实现groupby？

最近学习了hbase协处理器我使用endpoint来累加hbase表的一列例如名为 pendings 的hbase表它的家族是 asset 我累加了 asset amount 的所有值该表还有其他列例如 asset custom
Pandas、大数据、HDF 表以及调用函数时的内存使用情况

简短的问题当 Pandas 在 HDFStore 上工作时例如 mean 或 apply 它是否将内存中的完整数据作为 DataFrame 加载还是将逐条记录作为 Serie 进行处理详细描述我必须处理大型数据文件并且我可以指定
给定日期时间列的熊猫按周分组

假设我有以下数据样本 df pd DataFrame date 2011 01 01 2011 01 02 2011 01 03 2011 01 04 2011 01 05 2011 01 06 2011 01 07 2011 01 08
如何用 pandas 中两个日期之间计算的值填充列？

我有这个数据框 Date Position TrainerID Win 2017 09 03 4 1788 0 0 wins 1 race 2017 09 16 5 1788 0 0 wins 2 races 2017 10 14 1 17
pyspark 中的 Pandas UDF

我正在尝试在 Spark 数据帧上填充一系列观察结果基本上我有一个日期列表我应该为每个组创建缺失的日期在熊猫中有reindex函数这是 pyspark 中不可用的我尝试实现 pandas UDF pandas udf schema
sql server 按组排名

问题看似简单但我却无法理解这是针对 sql 服务器的 what I have in a table What I need as a output cksum id cksum id 2162514679 204 2162514679
Geopandas 设置几何图形：MultiPolygon“等于 len 键和值”的 ValueError

我有 2 个带有几何列的地理数据框我将一些几何图形从 1 个复制到另一个这对于多边形效果很好但对于任何有效多多边形都会返回 ValueError 请指教如何解决这个问题我不知道是否如何为什么应该更改 MultiPolygon
表达式中的 Python 'in' 关键字与 for 循环中的比较 [重复]

这个问题在这里已经有答案了我明白什么是in运算符在此代码中执行的操作 some list 1 2 3 4 5 print 2 in some list 我也明白i将采用此代码中列表的每个值 for i in 1 2 3 4 5 print
Python 3 中“map”类型的对象没有 len()

我在使用 Python 3 时遇到问题我得到了 Python 2 7 代码目前我正在尝试更新它我收到错误类型错误 map 类型的对象没有 len 在这部分 str len seed candidates 在我像这样初始化它之前 se
Pandas loc 有条件的替代方案

我计划提高非 Pandas 开发人员的可读性我有以下内容workingPython 代码使用 loc new value stackoverflow s query nbc SUGGESTED suggested QUERY query
如何添加 id 列来标识 read_html() 表？

考虑以下站点 site1 http pastebin com vpnGqn5X site2 http pastebin com FbAFGbfR site3 http pastebin com LqZWxFSP 其中有许多不同的表我在用读
shap.TreeExplainer 和 shap.Explainer 条形图之间的区别

对于下面给出的代码我得到了不同的条形图shap values 在此示例中我的数据集为 1000train样本有 9 个类别和 500 个test样品然后我使用随机森林作为分类器并生成模型当我开始生成shap条形图在这两种情况下得到
如何替换 pandas 数据框列中的重音符号

我有一个数据框dataSwiss其中包含瑞士城市的信息我想用普通字母替换带有重音符号的字母这就是我正在做的 dataSwiss Municipality dataSwiss Municipality str encode utf 8 d
根据列值突出显示数据框中的行？

假设我有这样的数据框 col1 col2 col3 col4 0 A A 1 pass 2 1 A A 2 pass 4 2 A A 1 fail 4 3 A A 1 fail 5 4 A A 1 pass 3 5 A A 2 fail 2

随机推荐

如何在没有管理员权限的情况下在 VS Code(Windows) 中使用自定义字体来安装字体？

我在我的工作电脑 Windows 7 上没有管理员权限所以我无法将自定义字体 Fira Code 安装到我的系统中有没有办法在 VS Code 中不安装就可以使用这种字体为这个问题找到一个丑陋的解决方法使用 webfont 打开菜单
调用基本方法而不是覆盖方法

在 C 中类A包含一个公共方法Foo 它进行一些处理并返回一个值 protected method Bar 也在课堂上A执行与以下相同的逻辑Foo 然后进行一些额外的处理然后返回一个值为了避免重复代码 Bar calls Foo 并使
将bitbucket发布到数字海洋

我本质上是试图使用 bitbucket 来理解 git 的概念我一直在通过修改本地帐户和 bitbucket 帐户之间的文件来练习版本控制事实证明这很有帮助现在我正在尝试弄清楚如何将文件从 bitbucket 或者我猜是 GitHub
检测对项目外部 RecyclerView 的点击

我有一个 RecyclerView 其中有 2 个项目没有填满整个屏幕如何检测用户单击了 RecyclerView 的空白部分意味着直接单击了 RecyclerView 而不是其项目之一正如评论中提到的 mRecyclerView a
调用线程无法访问该对象，因为另一个线程拥有它

我已经阅读了很多关于此错误的帖子但我不明白如何在我的解决方案中解决它我有一个进度条对话框其中包含一些逻辑通过按钮单击从 MainFrame 调用 void OnBtnClick object sender RoutedEventAr
Spring Cloud Streams无法自动装配Source.class

我正在从头开始学习 Spring Cloud Streams 我尝试创建一个像这样的源应用程序 import org springframework cloud stream messaging Source etc RestControl
如何在 C# 中将 ListView 与目录和文件绑定

我想在 C 的 ListView 中绑定 C 驱动器中的所有目录和文件我的代码是 protected void Page Load object sender EventArgs e DirectoryInfo di new Direct
SQL Server 行锁

如何在 SQL Server 2005 中进行行锁定我执行一条 sql 进行行锁定即 SELECT FROM authors WITH HOLDLOCK ROWLOCK WHERE au id 274 80 9391 它工作正常但在这
如何将自己的js文件导入到vite中？

我将 Laravel 与 Vite 结合使用我想使用 Vanilla JS 代码添加文件在我使用mix之前我从来没有使用过Vite 我尝试将此代码添加到文件 vite config js 中如下例所示 laravel input r
Haskell：不在范围内：数据构造函数

今天开始在学校学习 haskell 我遇到了函数问题我不明白为什么它不在范围内代码如下 ff Char gt Char gt Char ff A B x 0 y 1 x lt A y lt B x 1 y 0 和错误 md31 hs 2
如何从代码隐藏运行存储过程（带参数 - 有返回值）？

如何使用存储过程带参数具有类型的返回值int 从代码后面我的存储过程如下所示 ALTER Procedure dbo sp Noskheh SumOfTotalPay Co ID int AS Declare Sum bigint B
运算符“">”不能应用于类型“ulong”和“int”

我很好奇为什么 C 编译器只为第二个 if 语句提供错误消息 enum Permissions ulong ViewListItems 1L public void Method int mask 138612833 int compare
重复条目：自定义 Android 模块中的 org/appcelerator/titanium/gen/bindings.json

设置问题我为 Titanium 创建了一个自定义 Android 模块用于在 Ti 内显示 Gif 动画模块源代码可以在这里找到 https github com m1ga com miga gifview https github
ruby 认为我正在引用顶级常量，即使我指定了完整的命名空间

在我的应用程序中我有 class User include User Foo end User Foo定义在 app models user foo rb 中现在我正在使用一个定义自己的库Foo班级我收到此错误警告 User Foo
为沙盒 Cocoa 应用程序创建临时文件

我的应用程序是沙箱化的根据最新的应用程序商店指南我想创建一些临时文件我可以这样做吗如果是我可以在哪里这样做有没有预先指定的路径还有访问该路径的命令您应该使用NSTemporaryDirectory 函数它将查找并返回适合
按外键字段的计数排序？

我有一个用户模型和一个提交模型每个提交都有一个名为 user subscribed 的外键字段用于上传该提交的用户 class Submission models Model uploaded by models ForeignKey
jquery-traversing：选择 -> 选项 -> 文本

我想将变量与选择 gt 选项 gt 选择的文本进行比较以更改选定属性这是我的代码它有效但我认为这不是最好的编写方式请原谅我的英语我使用谷歌翻译寻求帮助嘿嘿嘿 var lista example 1 id option eac
使用纯 CSS 创建向上和向下箭头图标或按钮

我正在尝试使用纯 CSS 且无背景图像创建如下所示的向上和向下控制按钮但是当我在中添加箭头的CSS时li className after or li className before 主盒子的位置移动了这是我遇到的问题的小提琴 g
将 nvidia 运行时添加到 docker 运行时

我正在运行虚拟机GCP配备特斯拉 GPU 并尝试部署一个PyTorch基于应用程序使用 GPU 加速我想让 docker 使用这个 GPU 可以从容器访问它我设法在主机上安装了所有驱动程序并且该应用程序在那里运行良好但是当我尝试在
Pandas 中的 Groupby、转置和追加？

我有一个数据框如下所示每个用户有10条记录现在我想创建一个如下所示的数据框 userid name1 name2 name10 这意味着我需要反转该列的每 10 条记录name并附加到新的数据框那么它是如何做到的呢有什么办法可

Pandas 中的 Groupby、转置和追加？

示范

Pandas 中的 Groupby、转置和追加？ 的相关文章

随机推荐

热门标签

Pandas 中的 Groupby、转置和追加？的相关文章