pandas 按两列分组并按平均值汇总

2023-11-26

我有一个像这样的数据框：

df = pd.DataFrame()
df['id'] = [1,1,1,2,2,3,3,3,3,4,4,5]
df['view'] = ['A', 'B', 'A', 'A','B', 'A', 'B', 'A', 'A','B', 'A', 'B']
df['value'] = np.random.random(12)


    id view     value
0    1    A  0.625781
1    1    B  0.330084
2    1    A  0.024532
3    2    A  0.154651
4    2    B  0.196960
5    3    A  0.393941
6    3    B  0.607217
7    3    A  0.422823
8    3    A  0.994323
9    4    B  0.366650
10   4    A  0.649585
11   5    B  0.513923

我现在想总结一下每个id each view通过“价值”。将此视为某些 id 重复观察的视图，我想对其进行总结。例如，id 1 对 A 有两个观测值。

I tried

res = df.groupby(['id', 'view'])['value'].mean()

这实际上几乎是我想要的，但是 pandas 结合了id and view列成一列，这是我不想要的。

id  view
1   A       0.325157
    B       0.330084
2   A       0.154651
    B       0.196960
3   A       0.603696
    B       0.607217
4   A       0.649585
    B       0.366650
5   B       0.513923

res.shape 的尺寸也是 (9,)

我想要的输出是这样的：

id  view    value
1   A       0.325157
1   B       0.330084
2   A       0.154651
2   B       0.196960
3   A       0.603696
3   B       0.607217
4   A       0.649585
4   B       0.366650
5   B       0.513923

保留列名和维度以及重复 id 的位置。每个 id 对于 A 和 B 只能有 1 行。

我怎样才能实现这个目标？

你需要reset_index或参数as_index=False in groupby，因为你得到MuliIndex默认情况下，较高级别的索引是稀疏化让控制台输出更容易看懂：

np.random.seed(100)
df = pd.DataFrame()
df['id'] = [1,1,1,2,2,3,3,3,3,4,4,5]
df['view'] = ['A', 'B', 'A', 'A','B', 'A', 'B', 'A', 'A','B', 'A', 'B']
df['value'] = np.random.random(12)
print (df)
    id view     value
0    1    A  0.543405
1    1    B  0.278369
2    1    A  0.424518
3    2    A  0.844776
4    2    B  0.004719
5    3    A  0.121569
6    3    B  0.670749
7    3    A  0.825853
8    3    A  0.136707
9    4    B  0.575093
10   4    A  0.891322
11   5    B  0.209202

res = df.groupby(['id', 'view'])['value'].mean().reset_index()
print (res)
   id view     value
0   1    A  0.483961
1   1    B  0.278369
2   2    A  0.844776
3   2    B  0.004719
4   3    A  0.361376
5   3    B  0.670749
6   4    A  0.891322
7   4    B  0.575093
8   5    B  0.209202

res = df.groupby(['id', 'view'], as_index=False)['value'].mean()
print (res)
   id view     value
0   1    A  0.483961
1   1    B  0.278369
2   2    A  0.844776
3   2    B  0.004719
4   3    A  0.361376
5   3    B  0.670749
6   4    A  0.891322
7   4    B  0.575093
8   5    B  0.209202

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

pandas 按两列分组并按平均值汇总的相关文章

Python 类型提示 Dict 语法错误可变默认值是不允许的。使用“默认工厂”

我不知道为什么解释器会抱怨这个类型的字典对于这两个实例我得到一个不允许可变默认值使用默认工厂语法错误我使用的是 python 3 7 3 from dataclasses import dataclass from typing
Python - 比较同一字典中的值

我有一本字典 d Trump MAGA FollowTheMoney Clinton dems Clinton Stein FollowTheMoney Atlanta 我想删除字符串列表中的重复字符串该字符串是键的值对于这个例子期望
让 VoiceChannel.members 和 Guild.members 返回完整列表的问题

每当我尝试使用 VoiceChannel members 或 Guild members 时它都不会提供适用成员的完整列表我从文本命令的上下文中获取 VoiceChannel 和 Guild 如下所示 bot command name
如何在 Matplotlib 饼图周围绘制箭头以将每个标签指向圆圈中各自的部分？

我一直在用 Matplotlib 绘制一些图表我有一个饼图想要在图表周围绘制箭头使每个标签都指向图表我有一个例子这是我当前的代码 import matplotlib pyplot as plt plt rcParams font
我应该使用 Python 双端队列还是列表作为堆栈？ [复制]

这个问题在这里已经有答案了我想要一个可以用作堆栈的 Python 对象使用双端队列还是列表更好元素数量较少还是数量较多有什么区别您的情况可能会根据您的应用程序和具体用例而有所不同但在一般情况下列表非常适合堆栈 append is
python multiprocessing 设置生成进程等待

是否可以生成一些进程并将生成进程设置为等待生成的进程完成下面是我用过的一个例子 import multiprocessing import time import sys def daemon p multiprocessing curr
为什么 web2py 在启动时崩溃？

我正在尝试让 web2py 在 Ubuntu 机器上运行所有文档似乎都表明要在 nix 系统上运行它您需要下载源代码并执行以下操作蟒蛇 web2py py 我抓住了source http www web2py com examples
PyQt 使用 ctrl+Enter 触发按钮

我正在尝试在我的应用程序中触发确定按钮我当前尝试的代码是这样的 self okPushButton setShortcut ctrl Enter 然而它不起作用这是有道理的我尝试查找一些按键序列here http ftp ics
GUI（输入和输出矩阵）？

我需要创建一个 GUI 将数据输入到矩阵或表格中并读取此表单数据完美的解决方案是限制输入表单仅允许float 例如 A 1 02 0 25 0 30 0 515 0 41 1 13 0 15 1 555 0 25 0 14 1 21 2
Python - 如何确定解析的 XML 元素的层次结构级别？

我正在尝试使用 Python 解析 XML 文件中具有特定标记的元素并生成输出 excel 文档该文档将包含元素并保留其层次结构我的问题是我无法弄清楚每个元素解析器在其上迭代的嵌套深度 XML 示例摘录 3 个元素它们可以任意嵌套
将 Matlab 的 datenum 格式转换为 Python

我刚刚开始从 Matlab 迁移到 Python 2 7 在读取 mat 文件时遇到一些问题时间信息以 Matlab 的日期数字格式存储对于那些不熟悉它的人日期序列号将日历日期表示为自固定基准日期以来已经过去的天数在 MATLAB
Python GTK+ 画布

我目前正在通过 PyGobject 学习 GTK 需要画布之类的东西我已经搜索了文档发现两个小部件似乎可以完成这项工作 GtkDrawingArea 和 GtkLayout 我需要一些基本函数如 fillrect 或 drawline
在 Google App Engine 中，如何避免创建具有相同属性的重复实体？

我正在尝试添加一个事务以避免创建具有相同属性的两个实体在我的应用程序中每次看到新的 Google 用户登录时我都会创建一个新的播放器当新的 Google 用户在几毫秒内进行多个 json 调用时我当前的实现偶尔会创建重复的播放器
PySpark groupByKey 返回 pyspark.resultiterable.ResultIterable

我试图找出为什么我的 groupByKey 返回以下内容 0
如何使用 AWS Lambda Python 读取 AWS S3 存储的 Word 文档（.doc 和 .docx）文件内容？

我的场景是我尝试使用 python 实现从 Aws Lambda 读取 AWS 存储的 S3 word 文档 doc 和 docx 文件内容下面的代码是我使用的我的问题是我可以获取文件名但无法读取内容 def lambda hand
重新分配唯一值 - pandas DataFrame

我在尝试着assign unique值在pandas df给特定的个人 For the df below Area and Place 会一起弥补unique不同的价值观jobs 这些值将分配给个人总体目标是使用尽可能少的个人诀窍在于这
Firebase Firestore：获取文档的生成 ID (Python)

我可以创建一个新文档带有自动生成的 ID 并存储对其的引用如下所示 my data key value doc ref db collection u campaigns add my data 我可以像这样访问数据本身 print d
根据 Pandas 中的列表选择数据框行的子集

我有一个数据框df1并列出x In 22 import pandas as pd In 23 df1 pd DataFrame C range 5 B range 10 20 2 A list abcde In 24 df1 Out 24
JSON：TypeError：Decimal（'34.3'）不是JSON可序列化的[重复]

这个问题在这里已经有答案了我正在运行一个 SQL 查询它返回一个小数列表当我尝试将其转换为 JSON 时出现类型错误查询 res db execute SELECT CAST SUM r SalesVolume 1000 0 AS
NLTK：查找单词大小为 2k 的上下文

我有一个语料库我有一个词对于语料库中该单词的每次出现我想获取一个包含该单词之前的 k 个单词和该单词之后的 k 个单词的列表我在算法上做得很好见下文但我想知道 NLTK 是否提供了一些我错过的功能来满足我的需求 def size

随机推荐

以纯色作为背景的 SVG 形状透明度

我有一个 svg 容器用作背景里面画了一个圆圈基本上这就是我所做的
Spring MVC 和 Angularjs

目前我正在努力学习Angular JS 但首先我想设置我的环境Spring mvc 目前我只想休息工作但我怀疑什么是放置资源的最佳方式Spring MVC 我的简单应用程序有这个骨架 my simple app src main java
如何在给定依赖项列表的情况下将 Dojo 构建到单个文件中？

我有一个简单的 Dojo 应用程序它只执行一项操作require调用加载所有依赖项问题是虽然它非常简单但最终仍然会从服务器加载约 100 个文件我尝试使用 Dojo 构建系统来解决这个问题但似乎我没有足够深入的理解所以我的问
如何使用ajax在不刷新页面的情况下将数据库中的值显示到jsp

我是 Ajax 新生 Ajax function ajaxFunction if xmlhttp var txtname document getElementById txtname xmlhttp open POST Namelist
是否有编译器标志表明缺少armv7s架构

随着iPhone 5和其他armv7s设备的出现现有的闭源第3方框架例如Flurry 存在兼容性问题这些框架是在没有这种新架构的情况下构建的一种选择是等到他们发布新版本但我希望可能有一个编译器标志或我可以在我的 Xcode 项
如何从源代码授予对特定应用程序的 root 访问权限而不是对 ROM 进行 root 访问？

我正在从源代码编译 Android ROM 并且我有一个应用程序我希望它能够预安装并以 root 权限运行如何在不 root 整个 ROM 的情况下授予该特定应用程序的 root 访问权限希望你不需要root 典型的 Android
Symfony：清除学说缓存

我需要清除我的学说的缓存在Symfony 命令行中必须有某种方法清除缓存或者我应该在哪里找到并删除属于缓存的文件对于 Symfony 3 php bin console 将列出所有命令以下与缓存相关 php bin console d
PostgreSQL、Rails 和 :order => 问题

我的 ActiveRecord 模型中有以下行 class Record lt ActiveRecord Base has many users through gt record users uniq gt true order gt r
如何检查 AWS S3 存储桶中是否存在资源

我有一个 AWS S3 存储桶其中有多个文件夹 s3 AWS S3 new bucket s3 buckets test bucket exists gt true 假设我有一个名为demo index html 我将如何检查该资源是否存
如何在 ASP.NET MVC 中生成加密哈希？

我正在考虑创建一个自定义会员登录系统用于学习但我无法弄清楚生成加密哈希的 C 命令我需要导入某个名称空间或类似的东西吗使用命名空间 System Security Cryptography MD5 md5 new MD5Crypto
从 Web 浏览器控件打开证书信息

有谁知道如何打开基于 SSL 的证书信息屏幕WebBrowser控制这可以通过使用一个名为的类来实现X509Certificate2UI 要使此类可供您使用您需要添加对System Security dll In the X509C
使用 scala 2.10 反射对类型参数进行运行时解析

给定类型声明我能够解析类型参数 scala gt reflect runtime universe typeOf List Int match case x TypeRef gt x args res10 List reflect run
如果在引用类之前未调用静态初始化程序，如何注册 java 类

我有一个由执行文件处理例如搜索或其他的类实现的接口 public interface FileProcessorInterface public void processFile String fileName 然后我对每种文件类型有不
将 Crosswalk 插件添加到 Cordova Android 项目后生成错误

我正在使用最新的科尔多瓦安卓 5 1 0 该项目在没有人行横道的情况下构建和运行良好但是在我使用添加人行横道插件后 cordova plugin add https github com crosswalk project cordova
Hibernate - spring 注释的实体未从 jar 内扫描

我有一个包含带注释的实体类的包我将其导入到我的 Web 项目中当 tomcat 部署项目时不会扫描 jar 中的实体类是否有注释有没有办法告诉 spring 在 jar 文件中搜索带注释的类 IE
CodeIgniter - 如何捕获数据库错误？

有没有办法制作CI扔一个例外当它遇到一个DB error而不是显示如下消息发生数据库错误错误号 1054 where 子句中的未知列 foo SELECT FROM FooBar WHERE foo 1 注意我只希望这种情况发生在一个
生成多个范围之间的随机数

我了解如何生成两个数字之间的随机数 1 int Math random 10 1 1 or min int Math random max min 1 但是我如何生成一个属于多个范围的随机数呢例如数字可以在 1 到 10 之间或 50
需要 JavaCV FFmpegFrameRecorder 属性解释

我在用着FFmpegFrameRecorder从我的网络摄像头获取视频输入并将其记录到视频文件中问题是我正在使用我发现的一些不同的演示源代码构建我的应用程序并且我使用其中一些属性对我来说并不完全清楚首先这是我的代码片段 FFmpeg
使用 dyn.load 在 R x64 中加载已编译的 C 代码时出现问题

我最近从32位笔记本换成了64位台式机都是win7 我刚刚发现使用加载 dll 时出现错误dyn load 我想这是一个简单的错误我忽略了一些事情例如我编写了这个简单的 c 函数 foo c void foo int x x x 1
pandas 按两列分组并按平均值汇总

我有一个像这样的数据框 df pd DataFrame df id 1 1 1 2 2 3 3 3 3 4 4 5 df view A B A A B A B A A B A B df value np random random 12 i

pandas 按两列分组并按平均值汇总

pandas 按两列分组并按平均值汇总 的相关文章

随机推荐

热门标签

pandas 按两列分组并按平均值汇总的相关文章