将函数应用于 pandas 数据框中的组

2023-11-23

我正在尝试将简单的函数应用于 pandas 中的组。我有这个数据框，我可以根据它进行分组type:

df = pandas.DataFrame({"id": ["a", "b", "c", "d"], "v": [1,2,3,4], "type": ["X", "Y", "Y", "Y"]}).set_index("id")
df.groupby("type").mean()  # gets the mean per type

我想应用像这样的函数np.log2在取每组的平均值之前仅对组进行计算。这不起作用，因为apply是元素明智的并且type（以及潜在的其他列df在真实场景中）不是数字：

# fails
df.apply(np.log2).groupby("type").mean()

有办法申请吗np.log2只对取平均值之前的组进行？我想transform这将是答案，但问题是它返回一个没有原始数据的数据框type列：

df.groupby("type").transform(np.log2)
           v
id          
a   0.000000
b   1.000000
c   1.584963
d   2.000000

像分组然后应用这样的变体不起作用：df.groupby("type").apply(np.log2)。这样做的正确方法是什么？

问题是np.log2无法处理第一列。相反，您只需要传递数字列。您可以按照评论中的建议执行此操作，或者定义一个lambda:

df.groupby('type').apply(lambda x: np.mean(np.log2(x['v'])))

根据评论，我将定义一个函数：

df['w'] = [5, 6, 7,8]

def foo(x):
     return x._get_numeric_data().apply(axis=0, func=np.log2).mean()

df.groupby('type').apply(foo)

#              v         w
# type                    
# X     0.000000  2.321928
# Y     1.528321  2.797439

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

NumPy

pandas

DataFrame

将函数应用于 pandas 数据框中的组的相关文章

多输出堆叠回归器

一次性问题我正在尝试构建一个多输入堆叠回归器添加到 sklearn 0 22 据我了解我必须结合StackingRegressor and MultiOutputRegressor 经过多次尝试这似乎是正确的顺序 import nu
VSCode Settings.json 丢失

我正在遵循教程并尝试将 vscode 指向我为 Scrapy 设置的虚拟工作区但是当我在 VSCode 中打开设置时工作区设置选项卡不在用户设置选项卡旁边我还尝试通过以下方式手动转到文件 APPDATA Code User s
Django Rest Framework 是否有第三方应用程序来自动生成 swagger.yaml 文件？

我有大量的 API 端点编写在django rest framework并且不断增加和更新如何创建和维护最新的 API 文档我当前的版本是 Create swagger yaml文件并以某种方式在每次端点更改时自动生成然后使用此文件作
为什么 web2py 在启动时崩溃？

我正在尝试让 web2py 在 Ubuntu 机器上运行所有文档似乎都表明要在 nix 系统上运行它您需要下载源代码并执行以下操作蟒蛇 web2py py 我抓住了source http www web2py com examples
更好地相当于这个疯狂的嵌套 python for 循环

for a in map for b in map a for c in map b for d in map c for e in map d print a b c d e 上面的代码用于创建图中一定长度的所有路径 map a 表示从
打印数字时添加千位分隔符[重复]

这个问题在这里已经有答案了我真的不知道这个问题的名称所以它可能是一个不正确的标题但问题很简单如果我有一个数字例如 number 23543 second 68471243 我想要它使print 像这样 23 54368 471
Python 内置的 super() 是否违反了 DRY？

显然这是有原因的但我没有足够的经验来认识到这一点这是Python中给出的例子docs http docs python org 2 library functions html super class C B def method se
在 DataFrame.withColumn 中，如何检查列的值是否为 null 作为第二个参数的条件？

如果我有一个名为 df 的 DataFrame 如下所示 a1 a2 foo bar N A baz null etc 我可以有选择地替换值如下所示 val df2 df withColumn a1 when a1 N A a2 这样 d
从 Powershell 脚本安装 Python

当以管理员身份从 PowerShell 命令行运行以下命令时可以在 Windows 11 上成功安装 Python c temp python 3 11 4 amd64 exe quiet InstallAllUsers 0 Instal
为什么一旦我离开内置的运行服务器，Django 就无法找到我的管理媒体文件？

当我使用内置的简单服务器时一切正常管理界面很漂亮 python manage py runserver 但是当我尝试使用 wsgi 服务器为我的应用程序提供服务时django core handlers wsgi WSGIHandle
使用 python/numpy 重塑数组

我想重塑以下数组 gt gt gt test array 11 12 13 14 21 22 23 24 31 32 33 34 41 42 43 44 为了得到 gt gt gt test2 array 11 12 21 22 13 14
Python GTK+ 画布

我目前正在通过 PyGobject 学习 GTK 需要画布之类的东西我已经搜索了文档发现两个小部件似乎可以完成这项工作 GtkDrawingArea 和 GtkLayout 我需要一些基本函数如 fillrect 或 drawline
在 Google App Engine 中，如何避免创建具有相同属性的重复实体？

我正在尝试添加一个事务以避免创建具有相同属性的两个实体在我的应用程序中每次看到新的 Google 用户登录时我都会创建一个新的播放器当新的 Google 用户在几毫秒内进行多个 json 调用时我当前的实现偶尔会创建重复的播放器
为什么 csv.DictReader 给我一个无属性错误？

我的 CSV 文件是 200 Service 我放入解释器的代码是 snav csv DictReader open screennavigation csv delimiter print snav fieldnames 200 for
如何以正确的方式为独立的Python应用程序制作setup.py？

我读过几个类似的主题但还没有成功我觉得我错过或误解了一些基本的事情这就是我失败的原因我有一个用 python 编写的应用程序我想在标准 setup py 的帮助下进行部署由于功能复杂它由不同的 python 模块组成但单独
如何从pandas中的多列计算多列

我正在尝试使用函数从 pandas 数据框中的多个列计算多个列该函数采用三个参数 a b 和 c 并返回三个计算值 sum prod 和 quot 在我的 pandas 数据框中我有三个列 a b 和 c 我想从中计算列 sum pro
如何在 Flask 中的视图函数/会话之间传递复杂对象

我正在编写一个 Web 应用程序当且仅当用户登录时该应用程序从第三方服务器接收大量数据这些数据被解析为自定义对象并存储在list 现在用户在应用程序中使用这些数据调用不同的视图例如发送不同的请求我不确定什么是最好的模式在视
将索引与值交换的最快方法

考虑pd Series s s pd Series list abcdefghij list ABCDEFGHIJ s A a B b C c D d E e F f G g H h I i J j dtype object 交换索引和值并
JSON：TypeError：Decimal（'34.3'）不是JSON可序列化的[重复]

这个问题在这里已经有答案了我正在运行一个 SQL 查询它返回一个小数列表当我尝试将其转换为 JSON 时出现类型错误查询 res db execute SELECT CAST SUM r SalesVolume 1000 0 AS
NLTK：查找单词大小为 2k 的上下文

我有一个语料库我有一个词对于语料库中该单词的每次出现我想获取一个包含该单词之前的 k 个单词和该单词之后的 k 个单词的列表我在算法上做得很好见下文但我想知道 NLTK 是否提供了一些我错过的功能来满足我的需求 def size

随机推荐

ASP.NET MVC - Linq to Entities 模型作为 ViewModel - 这是好的做法吗？ [关闭]

Closed 这个问题是基于意见的目前不接受答案真的是很快的问题我目前正在使用 asp net MVC 和实体框架构建一个网站我有几个存储库它们返回实体或实体列表我发现在我的大部分页面中我必须从各种相关表中提取数据只要我在查
在 Scala 中从类型别名创建对象 [重复]

这个问题在这里已经有答案了如何从 scala 中的类型别名构造一个对象 type MyType List Int println List Int println MyType error not found value MyType 这
MongoDB 查找日期范围是否与其他日期重叠

我有许多文档其架构如下所示每个文档都包含开始日期结束日期如下架构所示有没有一种简单的方法可以在保存新文档之前知道新文档的开始日期结束日期是否会与以前保存的文档开始日期结束日期重叠谢谢 title owner notes s
ElasticSearch：禁用 Groovy 时对 _score 字段进行聚合

我见过的每个例子例如 ElasticSearch 在 score 字段上聚合用于对 score 字段进行聚合或与 score 字段相关的聚合似乎需要使用脚本由于 ElasticSearch 出于安全原因默认禁用动态脚本有没有什么方法
扫描 NFC 标签后是否可以启动应用程序？

我有一个 NFC 标签我想编写一个 Android 应用程序当用手机扫描 NFC 标签时该应用程序会自动启动并从 NFC 获取数据假设设备已打开 NFC 并且手机上没有运行其他应用程序这应该可以工作我发现一些应用程序可以启动另一
带有实时数据的 NVD3 折线图

我有一个使用 NVD3 js 编写的非常简单的折线图我写了一个基于计时器的简单重绘从我见过的示例中提取但出现错误未捕获的类型错误无法读取未定义的属性 y JS 是 var data key Long values getData
C++ 中 lambda 派生的隐式函子的生命周期是多少？

问题很简单当我编写 lambda 表达式时 C 编译器自动生成的函子对象的生命周期是多少我进行了快速搜索但找不到满意的答案特别是如果我将 lambda 传递到某个地方并且它在那里被记住然后我超出范围那么一旦我的 lambda
将 JSON 对象映射到 Swift 类/结构

我需要复制从远程 Web API 服务以 JSON 格式返回的实体它看起来像这样 field1 some id entity name Entity1 field2 some name details1 field1 11 field
Firebase 在 Android 适配器中添加监听器

我对 firebase 还很陌生我正在尝试了解它我有一个正在注册的适配器ValueEventListener每次创建时如果我不分离它当我旋转手机并且适配器在片段中被破坏重建时侦听器是否会增加或者 firebase 是否足够聪明
如何使用 JSF 和导航规则创建带参数的 GET 请求？

有没有办法使用 h outputLink 其他 JSF 标记或代码创建 html 链接以创建带有请求参数的非 faces 请求 HTTP GET 例如我有以下导航规则
从 F# 中具有 N 个不同索引的序列中取出 N 个元素

我是 F 新手正在寻找一个采用 N 索引和序列并给我 N 个元素的函数如果我有 N 个索引它应该等于 concat Seq nth index0 Seq nth index1 Seq nth indexN 但它应该只扫描序列中的 in
当基础镜像为 centos 与 ubuntu:trusty 时，以 shell 形式运行 CMD/ENTRYPOINT 时，不同进程以 PID 1 运行

使用以下 dockerfile 构建并运行图像 Dockerfile1 FROM ubuntu trusty ENTRYPOINT ping localhost 现在运行以下命令来查看容器中运行的进程 docker exec it
“String[]::new”是什么意思？

我正在学习如何使用流但我遇到了这个方法的问题 public static String inArray String array1 String array2 return Arrays stream array1 filter str
何时使用 AtomicReference (Java)？真的有必要吗？

我已经多次使用 AtomicLong 但我从未需要使用 AtomicReference 看来 AtomicReference 可以做到其中之一我从另一个 stackoverflow 复制了这段代码问题 public synchroniz
从私钥生成 ssh 公钥

我有私人 ssh id rsa 密钥我如何从中生成公钥选项 y输出公钥来自linux手册ssh keygen命令 y 此选项将读取私有 OpenSSH 格式文件并打印一个到标准输出的 OpenSSH 公钥 ssh keygen y
Google Drive API v3：没有任何方法可以获取 google 文档的下载网址吗？

Google Drive API v2 到 v3迁移指南 says ExportLinks 字段已从文件中删除要导出 Google 文档请改用 files export 方法我不想立即导出下载文件 files export 实际上
自动调整 JButton 图标大小

所以我有一个 JButtons 我在其中添加了图标图标最初太大所以我事先调整了它们的大小效果很好除了当我调整窗口大小时 JButton 会更改大小但图标不会更改这是有问题的有没有办法让图标只填充它所附加的 JButton 一些
在 Node.js 中等待多个回调

我有一个 Node js 应用程序其中可能会调用多个函数具体取决于多个因素但在最后一个回调后仅调用最后一个函数这是我得到的简化版本 if foo bar function1 arg1 function val1 doWhatever
WPF ListView 非活动选择颜色

I m creating a WPF application where several ListView selections are made in a row similar to the iTunes browser The pro
将函数应用于 pandas 数据框中的组

我正在尝试将简单的函数应用于 pandas 中的组我有这个数据框我可以根据它进行分组type df pandas DataFrame id a b c d v 1 2 3 4 type X Y Y Y set index id df g

将函数应用于 pandas 数据框中的组

将函数应用于 pandas 数据框中的组 的相关文章

随机推荐

热门标签

将函数应用于 pandas 数据框中的组的相关文章