在 pandas 中展开列表列时，是否有一种Python式的方法来添加枚举列？

2024-05-26

考虑以下DataFrame:

>>> df = pd.DataFrame({'A': [1,2,3], 'B':['abc', 'def', 'ghi']}).apply({'A':int, 'B':list})
>>> df
   A          B
0  1  [a, b, c]
1  2  [d, e, f]
2  3  [g, h, I]

这是获得所需结果的一种方法：

>>> df['B'] = df['B'].apply(enumerate).apply(list)
>>> df = df.explode('B', ignore_index=True)
>>> df['B'] = pd.Series(df['B'], index=['B1', 'B2'])})
>>> df.droplevel(0, axis=1)
   A  B1 B2
0  1   0  a
1  1   1  b
2  1   2  c
3  2   0  d
4  2   1  e
5  2   2  f
6  3   0  g
7  3   1  h
8  3   2  i

有更简洁的方法吗？

索引上的 groupby 是一个选项：

df.explode('B').assign(
  B1 = lambda df: df.groupby(level=0).cumcount())

   A  B  B1
0  1  a   0
0  1  b   1
0  1  c   2
1  2  d   0
1  2  e   1
1  2  f   2
2  3  g   0
2  3  h   1
2  3  i   2

如果你不需要它，你可以随时重置索引：

df.explode('B').assign(
  B1 = lambda df: df.groupby(level=0).cumcount()).reset_index(drop=True)

   A  B  B1
0  1  a   0
1  1  b   1
2  1  c   2
3  2  d   0
4  2  e   1
5  2  f   2
6  3  g   0
7  3  h   1
8  3  i   2

Since pandas版本1.3.0您可以使用多列explode盒子外面：

df.assign(
  B1 = df.B.apply(len).apply(range)).explode(['B', 'B1'], ignore_index = True))

   A  B B1
0  1  a  0
1  1  b  1
2  1  c  2
3  2  d  0
4  2  e  1
5  2  f  2
6  3  g  0
7  3  h  1
8  3  i  2

我认为更快的选择是在 Pandas 外部运行重塑，然后重新加入数据帧（当然只有测试才能确认/否认这一点）：

from itertools import chain
# you can use np.concatenate instead
# np.concatenate(df.B)
flattened = chain.from_iterable(df.B)
index = df.index.repeat([*map(len, df.B)])
flattened = pd.Series(flattened, index, name = 'B1')
(pd.concat([df.A, flattened], axis=1)
  .assign(B2 = lambda df: df.groupby(level=0).cumcount())
)

   A B1  B2
0  1  a   0
0  1  b   1
0  1  c   2
1  2  d   0
1  2  e   1
1  2  f   2
2  3  g   0
2  3  h   1
2  3  i   2

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

enumeration

在 pandas 中展开列表列时，是否有一种Python式的方法来添加枚举列？的相关文章

将数据从 python pandas 数据框导出或写入 MS Access 表

我正在尝试将数据从 python pandas 数据框导出到现有的 MS Access 表我想用已更新的数据替换 MS Access 表在 python 中我尝试使用 pandas to sql 但收到错误消息我觉得很奇怪使用 p
Flask 会话变量

我正在用 Flask 编写一个小型网络应用程序当两个用户在同一网络下尝试使用应用程序时我遇到会话变量问题这是代码 import os from flask import Flask request render template
如何在 Python 中检索 for 循环中的剩余项目？

我有一个简单的 for 循环迭代项目列表在某些时候我知道它会破裂我该如何退回剩余的物品 for i in a b c d e f g try some func i except return remaining items if s
如何从网页中嵌入的 Tableau 图表中抓取工具提示值

我试图弄清楚是否有一种方法以及如何使用 python 从网页中的 Tableau 嵌入图形中抓取工具提示值以下是当用户将鼠标悬停在条形上时带有工具提示的图表示例我从要从中抓取的原始网页中获取了此网址 https covid19 colo
SQLALchemy .query：类“Car”的未解析属性引用“query”

我有一个这里已经提到的问题https youtrack jetbrains com issue PY 44557 https youtrack jetbrains com issue PY 44557 但我还没有找到解决方案我使用 Pyt
使用 Tkinter 显示 numpy 数组中的图像

我对 Python 缺乏经验第一次使用 Tkinter 制作一个 UI 显示我的数字分类程序与 mnist 数据集的结果当图像来自 numpy 数组而不是我的 PC 上的文件路径时我有一个关于在 Tkinter 中显示图像的问题我为
Python pickle：腌制对象不等于源对象

我认为这是预期的行为但想检查一下也许找出原因因为我所做的研究结果是空白我有一个函数可以提取数据创建自定义类的新实例然后将其附加到列表中该类仅包含变量然后我使用协议 2 作为二进制文件将该列表腌制到文件中稍后我重新运行脚本
如何使用 OpencV 从 Firebase 读取图像？

有没有使用 OpenCV 从 Firebase 读取图像的想法或者我必须先下载图片然后从本地文件夹执行 cv imread 功能有什么办法我可以使用cv imread link of picture from firebase 您可以
AWS EMR Spark Python 日志记录

我正在 AWS EMR 上运行一个非常简单的 Spark 作业但似乎无法从我的脚本中获取任何日志输出我尝试过打印到 stderr from pyspark import SparkContext import sys if name m
如何在Python中获取葡萄牙语字符？

我正在研究葡萄牙语角色看起来很奇怪我怎样才能解决这个问题代码 import feedparser import random Vou definir os feeds feeds conf feedurl http pplware s
BeautifulSoup 中的嵌套标签 - Python

我在网站和 stackoverflow 上查看了许多示例但找不到解决我的问题的通用解决方案我正在处理一个非常混乱的网站我想抓取一些数据标记看起来像这样 table tbody tr tr tr td td td table tr t
Pygame：有没有简单的方法可以找到按下的任何字母数字的字母/数字？

我目前正在开发的游戏需要让人们以自己的名义在高分板上计时我对如何处理按键有点熟悉但我只处理过寻找特定的按键有没有一种简单的方法可以按下任意键的字母而不必执行以下操作 for event in pygame event get if
使用 \r 并打印一些文本后如何清除控制台中的一行？

对于我当前的项目有一些代码很慢并且我无法使其更快为了获得一些关于已完成必须完成多少的反馈我创建了一个进度片段您可以在下面看到当你看到最后一行时 sys stdout write r100 80 n I use 80覆盖最终剩余的
如何在Python中对类别进行加权随机抽样

给定一个元组列表其中每个元组都包含一个概率和一个项目我想根据其概率对项目进行采样例如给出列表 3 a 4 b 3 c 我想在 40 的时间内对 b 进行采样在 python 中执行此操作的规范方法是什么我查看了 random 模
如何在seaborn displot中使用hist_kws

我想在同一图中用不同的颜色绘制直方图和 kde 线我想为直方图设置绿色为 kde 线设置蓝色我设法弄清楚使用 line kws 来更改 kde 线条颜色但 hist kws 不适用于显示我尝试过使用 histplot 但我无法为
有没有办法检测正在运行的代码是否正在上下文管理器内执行？

正如标题所述有没有办法做到这样的事情 def call back if called inside context print running in context else print called outside context 这将
Conda SafetyError：文件大小不正确

使用创建 Conda 环境时conda create n env name python 3 6 我收到以下警告 Preparing transaction done Verifying transaction SafetyError Th
识别 pandas 数据框中各组之间的差异

我有一个按日期和 ID 索引的 pandas 数据框我想识别日期之间增删的ID 将 ID 添加到另一个数据帧以及添加删除的日期 date ID value 12 31 2010 13 0 124409 9 0 555959 1 0 7
在 Qt 中自动调整标签文本大小 - 奇怪的行为

在 Qt 中我有一个复合小部件它由排列在 QBoxLayouts 内的多个 QLabels 组成当小部件调整大小时我希望标签文本缩放以填充标签区域并且我已经在 resizeEvent 中实现了文本大小的调整这可行但似乎发生了某
使用 Python 的 matplotlib 选择在屏幕上显示哪些图形以及将哪些图形保存到文件中

我想用Python创建不同的图形matplotlib pyplot 然后我想将其中一些保存到文件中而另一些则应使用show 命令然而 show 显示all创建的数字我可以通过调用来避免这种情况close 创建我不想在屏幕上显示的绘图

随机推荐

通过 TCP/.NET SSLStream 发送文件很慢/无法正常工作

我正在编写一个与 SSL 配合使用的服务器客户端应用程序通过SSLStream 它必须做很多事情不仅仅是文件接收发送目前它的工作原理是只有一个连接我总是使用从客户端服务器发送数据SSLStream WriteLine 并使
Debug.WriteLine() 未命中

我正在调试 Windows 服务通过点击F5在 Visual Studio 2010 中使用以下代码 In 程序 cs file static void Main if Environment UserInteractive We ar
在 Tomcat 中触发内部 ServletRequest

我正在使用 Quartz 来安排 Web 应用程序的后台任务其中一些任务只是针对同一 Web 应用程序发出请求我想避免依赖于任何类型的网络设置例如如果从数据中心内发出带有我自己域名的请求则可能无法正确路由是否有一个 Java A
Android 浏览器缩放？

我正在尝试为 Android 创建一个移动网站当我将主体宽度设置为 480px 屏幕宽度时结果比我预期的大 50 左右看来 android 正在缩放它所绘制的内容并弄乱了我所有的布局有谁知道如何禁用它或解决它我已经在使用这个您
没有数据库的 django 单元测试

是否有可能在不设置数据库的情况下编写 django 单元测试我想测试不需要数据库设置的业务逻辑虽然设置数据库很快但在某些情况下我真的不需要它您可以子类化 DjangoTestSuiteRunner 并重写 setup databas
在 PHP 扩展中，推荐从 std::string 返回值的方法

我们有一个简单的 PHP 函数其目的是调用 C 自由函数std string callLibrary std string 并返回其std string返回值目前看起来是这样的 PHP FUNCTION call library cha
如何让BackgroundWorker返回一个对象

我需要做RunWorkerAsync 返回一个List
Python 的最佳实践：assert command() == False [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
innerHTML 未写入 svg 组 Firefox 和 IE

我正在做一个项目遇到了障碍在 Chrome 中它按预期工作但在 Firefox 和 IE 中则不然下面的代码实际上只是真实项目代码的非常简化的版本基本上我正在尝试替换 svg 的每组中的圆圈因此我从预编码的圆圈开始然后删除
FROM 子句中子查询末尾随机字母的含义 - SQL

我终于成功将两个sql sum查询的结果求和了这家伙迈出了一小步我的问题与代码中的最后一个字符 Z 有关 SELECT SUM hr FROM SELECT SUM amount AS hr FROM Try again dbo tue
仅底部的框阴影

我有一盒内容需要为其提供阴影但我只想为盒子的底部提供阴影我用过这个css box shadow 0 3px 5px 000000 如果我给出这个代码它会显示左右和底部我只需要底部任何人都可以建议解决这个问题吗多谢添加类后您
Oracle SQL 查询日期格式

我总是对 ORACLE SQL 查询中的日期格式感到困惑并花几分钟时间去谷歌有人可以向我解释当数据库表中有不同格式的日期时解决问题的最简单方法吗例如我有一个日期列为 ES DATE 保存的数据为 27 APR 12 11 52 48
如何在 sed 中用“pwd”的结果替换令牌？

我正在尝试做这样的事情 sed s REPLACE WITH PATH pwd 不幸的是我出错了 sed e expression 1 char 23 unknown option to s 为什么会发生这种情况您需要使用不同的字符而不
在 Swift 中删除字符串中第一个字符的最简洁方法是什么？

我想删除字符串中的第一个字符到目前为止我想到的最简洁的事情是 display text display text substringFromIndex advance display text startIndex 1 我知道我们不能用
.NET：EventHandler 竞争条件修复如何工作？

以下模式用于在引发事件时避免竞争条件以防另一个线程取消订阅 MyEvent 使其为空 class MyClass public event EventHandler MyEvent public void F EventHandler h
cmd：找不到服务：活动#Error：ADB 在 flutter 中退出，退出代码为 1

更新 android studio 后我运行我的 flutter 程序错误表明 Launching lib main dart on AOSP on IA Emulator in debug mode Running Gradle ta
BigVideo.js 播放结束时 URL 重定向

我已经使用基于 Video js 的 BigVideo 在页面上实现了背景视频单击 div 时视频会在后台播放我一生都无法弄清楚如何在视频播放完毕后重定向到另一个 URL 这是我正在使用的代码视频播放链接 a href vids g
动态 getter 和 setter - 一种可能性

我正在尝试解决最近出现的一个问题假设我们想要并且知道如何在 javascript 中使用动态 getter 和 setter 就像 php 中的那样 get set 但由于 javascript 没有包罗万象的属性我们唯一能做的就是提供
从 C++ 中的函数返回二维数组[重复]

这个问题在这里已经有答案了可能的重复 C 从函数返回多维数组 https stackoverflow com questions 3716595 c returning multidimension array from function
在 pandas 中展开列表列时，是否有一种Python式的方法来添加枚举列？

考虑以下DataFrame gt gt gt df pd DataFrame A 1 2 3 B abc def ghi apply A int B list gt gt gt df A B 0 1 a b c 1 2 d e f 2 3

在 pandas 中展开列表列时，是否有一种Python式的方法来添加枚举列？

在 pandas 中展开列表列时，是否有一种Python式的方法来添加枚举列？ 的相关文章

随机推荐

热门标签

在 pandas 中展开列表列时，是否有一种Python式的方法来添加枚举列？的相关文章