Pandas 使用列作为后缀进行透视

2024-04-24

我有一个类似于以下示例的数据框：

Id	Type	Value_1	Value_2
1234	A	1	2
1234	B	1	2
789	A	1	2
789	B	1	2
567	A	1	2

我想转换以获得以下内容：

Id	Value_1_A	Value_1_B	Value_2_A	Value_2_B
1234	1	1	2	2
789	1	1	2	2
567	1		1

总之：使用“类型”列作为后缀复制值列并将数据帧转换为宽格式。

有没有任何干净、简单的方法可以在 pyspark 数据框或 pandas 上执行此操作？

In pandas我们会pivot https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.pivot.html然后折叠多索引Index.map https://pandas.pydata.org/docs/reference/api/pandas.Index.map.html:

new_df = df.pivot(index='Id', columns='Type')
new_df.columns = new_df.columns.map('_'.join)
# Or with an explicit format string like:
# new_df.columns = new_df.columns.map('{0[0]}_{0[1]}'.format)
new_df = new_df.reset_index()

new_df:

     Id  Value_1_A  Value_1_B  Value_2_A  Value_2_B
0   567        1.0        NaN        2.0        NaN
1   789        1.0        1.0        2.0        2.0
2  1234        1.0        1.0        2.0        2.0

数据框和导入：

import pandas as pd

df = pd.DataFrame({'Id': {0: 1234, 1: 1234, 2: 789, 3: 789, 4: 567},
                   'Type': {0: 'A', 1: 'B', 2: 'A', 3: 'B', 4: 'A'},
                   'Value_1': {0: 1, 1: 1, 2: 1, 3: 1, 4: 1},
                   'Value_2': {0: 2, 1: 2, 2: 2, 3: 2, 4: 2}})

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

PySpark

Pandas 使用列作为后缀进行透视的相关文章

pandas python 根据一个或多个其他列的子集更新 A 列的子集

Edit我修改了下面的部分描述以澄清功能和组的含义修复拼写错误并包含我尝试过的其他代码我的熊猫df有 450 万行和 23 列下表显示了几行df2这是从生成的df 它显示了两组 eeskin and hduquant 和三
使用 for 循环 Python 为数组赋值

我正在尝试将字符串的值分配给不同的数组索引但我收到一个名为列表分配超出范围的错误 uuidVal distVal uuidArray distArray for i in range len returnedList for beac
尽管 ioff() 和 matplotlib.use('Agg')，Pyplot“无法连接到 X 服务器 localhost:10.0”

我有一段代码它被不同的函数调用为我执行一些计算然后将输出绘制到文件中鉴于整个脚本可能需要一段时间才能运行更大的数据集并且由于我可能想在给定时间分析多个数据集所以我开始它screen然后断开连接并关闭我的腻子会话并在第二天再检查
使用 Twisted Python 的 UDP 客户端和服务器

我想创建一个服务器和客户端使用 Twisted 从网络发送和接收 UDP 数据包我已经用 Python 中的套接字编写了此代码但想利用 Twisted 的回调和线程功能然而我需要 Twisted 设计方面的帮助我想接收多种类型的
Python：动态向对象添加字段

我想知道是否可以动态向对象添加字段例如我希望能够添加如下内容 user object user first name John user last name Smith 当我在 Python 命令行解释器中执行该命令时我得到 Attr
Pandas：向量化局部范围操作（[i:i+2] 行的最大值和总和）

我希望在数据帧中的每一行的局部范围内进行计算同时避免速度缓慢for环形例如对于下面数据中的每一行我想找到未来 3 天内包括当天的最高气温以及未来 3 天内的总降雨量 Day Temperature Rain 0 30 4 1 3
计算二维笛卡尔坐标中不规则形状的边界

我正在寻找一种计算不规则形状边界的解决方案 Lats take a look at Square example 如果我有Minimum x and y and Maximum x and y like MaxX 5 MinX 1 MaxY
如何在 scikit-learn 的 SVM 中使用非整数字符串标签？ Python

Scikit learn 具有相当用户友好的用于机器学习的 python 模块我正在尝试训练用于自然语言处理 NLP 的 SVM 标记器其中我的标签和输入数据是单词和注释例如词性标记而不是使用双精度整数数据作为输入元组 1 2
Mac 上的 Errno 13 权限被拒绝

我只是测试如何从一个 py 文件调用外部 py 文件我有 2 个 py 文件都在同一目录中这是主要代码 runext py 假设调用 ext py import subprocess subprocess call Users tra
Celery 设计帮助：如何防止并发执行任务

我对 Celery AMQP 相当陌生正在尝试提出一个任务队列工作人员设计来满足以下要求我有多种类型的每用户任务例如 TaskA TaskB TaskC 这些每用户任务中的每一个都为系统中的一个特定用户读取写入数据因此
安装python启动文件

我如何安装pythonstartup文件以便它在命令上运行例如python myfile py 我尝试将其安装到我的 home myuserUbuntu的目录但它说我没有足够的权限此外不同的地方交替说它应该全部大写或全部小写前面
如何使用 Python Pandas 制作 DataFrame 切片并在特定切片中“fillna”？

问题让我们从 Kaggle 获取泰坦尼克号数据集我有包含 Pclass 性别和年龄列的数据框我需要用特定组的中位数填充年龄列中的 NaN 如果是来自一等的女性我想用一等女性的中位数填写她的年龄而不是整个年龄列的中位数问
python 中的异步编程

python 中有异步编程的通用概念吗我可以为一个函数分配一个回调执行它并立即返回主程序流无论该函数的执行需要多长时间吗您所描述的主程序流程在另一个函数执行时立即恢复不是通常所说的异步又名事件驱动编程而是多任务又名
Python：如何使用生成器来避免 sql 内存问题

我有以下方法来访问 mysql 数据库并且查询在服务器中执行我无权更改有关增加内存的任何内容我对生成器很陌生并开始阅读更多有关它的内容并认为我可以将其转换为使用生成器 def getUNames self globalUserQu
使用多行选项和编码选项读取 CSV

在 azure Databricks 中当我使用以下命令读取 CSV 文件时multiline true and encoding SJIS 似乎编码选项被忽略了如果我使用multiline选项 Spark 使用默认值encoding那
Flask APScheduler + Gunicorn 工作人员 - 在套接字修复后仍在运行任务两次

我有一个 Flask 应用程序我使用 Flask APScheduler 在我的数据库上运行计划查询并通过 cron 作业发送电子邮件我通过 Gunicorn 使用以下配置运行我的应用程序并通过主管进行控制 program myapp
Tensorboard——High-level节点的计算时间与其子节点计算时间的总和不同

继tutorial https www tensorflow org programmers guide graph viz在 TensorFlow 上我试图使用张量板来理解运行时统计数据我发现代表名称范围的高级节点的计算时间不等于其子
透视包含字符串的 Pandas Dataframe - “没有要聚合的数字类型”错误

关于此错误有很多问题但环顾四周后我仍然无法找到解决解决方案我正在尝试用字符串旋转数据框以使一些行数据变成列但到目前为止还没有成功我的 df 的形状
有效积累稀疏 scipy 矩阵的集合

我有一个 O N NxN 的集合scipy sparse csr matrix 每个稀疏矩阵都有 N 个元素集我想将所有这些矩阵加在一起以获得一个常规的 NxN numpy 数组 N 约为 1000 矩阵内非零元素的排列使得所得总和肯定不
无法在 Python 2.4 中解码 unicode 字符串

这是Python 2 4 中的这是我的情况我从数据库中提取一个字符串它包含一个变音的 o xf6 此时如果我运行 type value 它会返回 str 然后我尝试运行 decode utf 8 但收到错误 utf8 编解码器无法解

随机推荐

如何从 PHP 中的 json 响应中按键提取值 [重复]

这个问题在这里已经有答案了我正在使用 getResponse api 来获取订阅者的最新信息这是之后打印的内容var dump result object stdClass 2 1 updated gt int 1 我如何提取解码编
在 bash 中使用正则表达式从字符串中提取信息

我在 bash 中有一个字符串变量如下所示 SOGoTimeFormat H M SOGoMailShowSubscribedFoldersOnly 0 SOGoMailSignaturePlacement below SOGoLangu
Swift Struct 不符合 Equatable 协议？

如何使结构符合 Equatable 协议我正在使用 Xcode 7 3 1 struct MyStruct var id Int var value String init id Int value String self id id s
列出可用于 gstreamer 1.0 中 ksvideosrc 视频捕获的设备名称

我正在尝试使用 c 中的 gstreamer 1 0 查询 Windows 上可用视频捕获设备网络摄像头的列表我使用 ksvideosrc 作为源我能够捕获视频输入但我无法查询可用设备及其上限的列表在 gstreamer 0
如何在静态方法或自定义类中注入HttpClient？

我想使用角度HttpClient在静态方法或类中在类中不能将其定义为构造函数参数我尝试过类似的东西 export class SomeNotInjectableService static doSomething const injec
Ruby on Rails 3：link_创建新的嵌套资源？

我试图在 Rails 3 应用程序中创建一个链接来创建新的嵌套资源但我无法弄清楚链接到新嵌套资源的语法是什么解决方案确保您的资源正确嵌套在您的路由文件中 resources books do resources chapters e
Amazon S3：授予来自 IP 的匿名访问权限（通过存储桶策略）

我有一个 Amazon S3 存储桶并且希望将其可供特定计算机上的脚本使用而无需部署登录凭证所以我的计划是只允许从该机器的 IP 进行匿名访问我对亚马逊云还很陌生存储桶策略看起来是不错的选择我将以下策略添加到我的存储桶中 Ver
如何解决“允许的最大密钥长度为 900 字节”。

我有以下表结构 CREATE TABLE dbo Signature caption id nvarchar 512 NOT NULL signature id int NOT NULL 我想使用以下 alter 命令添加主键 ALTER
C# 中 System.String[*] 和 System.String[] 的区别

Edit 我知道 C 相当于For Each server As String In servers is foreach var item in servers 但是由于GetOPCServers返回对象应该将其转换为可迭代类型我正在
页面抓取以从谷歌财经获取价格

我试图通过抓取谷歌金融页面来获取股票价格我在 python 中使用 urllib 包然后使用正则表达式来获取价格数据当我让 python 脚本运行时它最初会运行一段时间几分钟然后开始抛出异常 HTTP 错误 503 服务不可用
如何设置“如果对象存在”条件？

有没有办法检查对象是否存在我不断收到需要对象错误我知道该对象不存在如果是这种情况我想绕过我的代码的一部分我不知道什么是我没有尝试过的 var codeName document getElementById testCode
如何阻塞直到BlockingQueue为空？

我正在寻找一种方法来阻止直到BlockingQueue是空的我知道在多线程环境下只要有生产者将物品放入BlockingQueue 可能会出现队列变空几纳秒后又充满项目的情况但是如果只有one生产者那么它可能希望在停止将项目放入
为 iPhone 或 Android 开发？（作为 C# 开发人员）[关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
如何使用 R 提取包含特定人名的句子

我正在使用 R 来提取包含特定人名的句子来自文本这是一个示例段落在蒂宾根他作为改革家遭到反对但在他的叔公约翰罗伊克林的推荐下他接受了马丁路德的召唤进入维滕贝格大学梅兰希顿 21 岁时成为维滕贝格的希腊语教授他研究圣经尤
根据 Python Pandas 中的描述场景和状态过滤产品

假设我在 Pandas DataFrame 中有以下产品描述我想保留满足以下条件的产品的所有产品描述对于每一个id in product descriptions 检查是否包含全部descriptions从至少 1 个场景scenar
DocumentDB IN 关键字与 Linq

您现在可以使用 DocumentDB 创建 IN 查询如下所示 SELECT FROM Families WHERE Families id IN AndersenFamily WakefieldFamily 但如果我使用 Linq 运行
Python GTTS 错误：AttributeError：“NoneType”对象没有属性“group”

我有一个项目正在进行文本到语音转换我的音频文件被存储为 mp3 但现在当我检查 Gtts api 时抛出错误我尝试搜索但找不到该错误的可行解决方案我的代码如下 def synth sent language en slow Fals
如何在 Raspberry Pi 上安装 PhantomJS 以便与 Python Selenium 一起使用？

我想使用运行 Python 脚本Selenium WebDriver with PhantomJS作为我的无头浏览器树莓派运行 Raspbian 我最初在 OS X 中编写了该脚本它运行良好但在尝试让它在树莓派上工作时我遇到了问题当
如何在 Palantir Foundry 中合并具有相同模式的多个数据集？

我有几个数据集想要在 Palantir Foundry 中合并我提前知道数据集是什么所有数据集的架构都是相同的即它们具有相同的列名称和列类型组合联合这些数据集的最佳方法是什么数据集A col1 col2 1 a 2 b 数据集
Pandas 使用列作为后缀进行透视

我有一个类似于以下示例的数据框 Id Type Value 1 Value 2 1234 A 1 2 1234 B 1 2 789 A 1 2 789 B 1 2 567 A 1 2 我想转换以获得以下内容 Id Value 1 A Val

Pandas 使用列作为后缀进行透视

Pandas 使用列作为后缀进行透视 的相关文章

随机推荐

热门标签

Pandas 使用列作为后缀进行透视的相关文章