groupby pandas 数据帧上的算术运算

2024-02-14

我有一个包含 40 列和 400000 行的 pandas 数据框。我创建了一个包含 3 列的汇总数据集。

现在，我需要根据其中两列计算百分比指标。 Python 抛出错误 -

unsupported operand type(s) for /: 'SeriesGroupBy' and 'SeriesGroupBy'

这是示例代码：

print sample_data
   date  part  receipt  bad_dollars  total_dollars  bad_percent
0     1   123       22           40            100          NaN
1     2   456       44           80            120          NaN
2     3   134       33           30            150          NaN
3     1   123       22           80            100          NaN
4     5   456       45           40             90          NaN
5     3   134       33           85            150          NaN
6     7   123       24           70            120          NaN
7     5   456       45           20             85          NaN
8     9   134       35           50            300          NaN
9     7   123       24          300            600          NaN

sample_data_group = sample_data.groupby(['date','part','receipt'])

sample_data_group['bad_percents']=sample_data_group['bad_dollars']/sample_data_group['total_dollars']

TypeError: unsupported operand type(s) for /: 'SeriesGroupBy' and 'SeriesGroupBy'

请帮忙！

您可以使用 groupby 对象上的 apply 来执行此操作：

import pandas as pd
import numpy as np

cols = ['index', 'date',  'part',  'receipt',  'bad_dollars',  'total_dollars',
        'bad_percent']
sample_data = pd.DataFrame([
[0,     1,   123,       22,           40,            100,          np.nan],
[1,     2,   456,       44,           80,            120,          np.nan],
[2,     3,   134,       33,           30,            150,          np.nan],
[3,     1,   123,       22,           80,            100,          np.nan],
[4,     5,   456,       45,           40,             90,          np.nan],
[5,     3,   134,       33,           85,            150,          np.nan],
[6,     7,   123,       24,           70,            120,          np.nan],
[7,     5,   456,       45,           20,             85,          np.nan],
[8,     9,   134,       35,           50,            300,          np.nan],
[9,     7,   123,       24,          300,            600,          np.nan]],
                           columns = cols).set_index('index', drop = True)

sample_data_group = sample_data.groupby(['date','part','receipt'])

xx = sample_data_group.apply(
         lambda x: x.assign(bad_percent = x.bad_dollars/x.total_dollars))\
                      .reset_index(['date','part', 'receipt'], drop = True)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

groupby

groupby pandas 数据帧上的算术运算的相关文章

Django 管理员在模型编辑时间歇性返回 404

我们使用 Django Admin 来维护导出到我们的一些站点的一些数据有时当单击标准更改列表视图来获取模型编辑表单而不是路由到正确的页面时我们会得到 Django 404 页面模板它是偶尔发生的我们可以通过重新加载三次来重现它
通过最小元素比较对 5 个元素进行排序

我必须在 python 中使用元素之间的最小比较次数来建模对 5 个元素的列表进行排序的执行计划除此之外复杂性是无关紧要的结果是一个对的列表表示在另一时间对列表进行排序所需的比较我知道有一种算法可以通过 7 次比较总是在元素之间
使用带有关键字参数的 map() 函数

这是我尝试使用的循环map功能于 volume ids 1 2 3 4 5 ip 172 12 13 122 for volume id in volume ids my function volume id ip ip 我有办法做到这一点
Django：按钮链接

我是一名 Django 新手用户尝试创建一个按钮单击该按钮会链接到我网站中的另一个页面我尝试了一些不同的例子但似乎没有一个对我有用举个例子为什么这不起作用
PyUSB 1.0：NotImplementedError：此平台不支持或未实现操作

我刚刚开始使用 pyusb 基本上我正在玩示例代码here https github com walac pyusb blob master docs tutorial rst 我使用的是 Windows 7 64 位并从以下地址下载 z
以编程方式停止Python脚本的执行？ [复制]

这个问题在这里已经有答案了是否可以使用命令在任意行停止执行 python 脚本 Like some code quit quit at this point some more code that s not executed sys e
Python pickle：腌制对象不等于源对象

我认为这是预期的行为但想检查一下也许找出原因因为我所做的研究结果是空白我有一个函数可以提取数据创建自定义类的新实例然后将其附加到列表中该类仅包含变量然后我使用协议 2 作为二进制文件将该列表腌制到文件中稍后我重新运行脚本
OpenCV 无法从 MacBook Pro iSight 捕获

几天后我无法再从 opencv 应用程序内部打开我的 iSight 相机 cap cv2 VideoCapture 0 返回并且cap isOpened 回报true 然而 cap grab 刚刚返回false 有任何想法吗示例代码
从 Flask 访问 Heroku 变量

我已经使用以下命令在 Heroku 配置中设置了数据库变量 heroku config add server xxx xxx xxx xxx heroku config add user userName heroku config add
Flask如何获取请求的HTTP_ORIGIN

我想用我自己设置的 Access Control Allow Origin 标头做出响应而弄清楚请求中的 HTTP ORIGIN 参数在哪里似乎很混乱我在用着烧瓶 0 10 1 以及HTTP ORIGIN似乎是这个的特点之一object
使用 \r 并打印一些文本后如何清除控制台中的一行？

对于我当前的项目有一些代码很慢并且我无法使其更快为了获得一些关于已完成必须完成多少的反馈我创建了一个进度片段您可以在下面看到当你看到最后一行时 sys stdout write r100 80 n I use 80覆盖最终剩余的
如何在Python中对类别进行加权随机抽样

给定一个元组列表其中每个元组都包含一个概率和一个项目我想根据其概率对项目进行采样例如给出列表 3 a 4 b 3 c 我想在 40 的时间内对 b 进行采样在 python 中执行此操作的规范方法是什么我查看了 random 模
Fabric env.roledefs 未按预期运行

On the 面料网站 http docs fabfile org en 1 10 usage execution html 给出这个例子 from fabric api import env env roledefs web hosts
对年龄列进行分组/分类

我有一个数据框说df有一个柱子 Ages gt gt gt df Age 0 22 1 38 2 26 3 35 4 35 5 1 6 54 我想对这个年龄段进行分组并创建一个像这样的新专栏 If age gt 0 age lt 2 the
类型错误：预期单个张量时的张量列表 - 将 const 与 tf.random_normal 一起使用时

我有以下 TensorFlow 代码 tf constant tf random normal time step batch size 1 1 我正进入状态TypeError List of Tensors when single Te
有人用过 Dabo 做过中型项目吗？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我们正处于一个新的 ERP 风格的客户端服务器应用程序的开始阶段该应用程序是作为 Python 富客户端开发的我们目前正在评估 Dabo
识别 pandas 数据框中各组之间的差异

我有一个按日期和 ID 索引的 pandas 数据框我想识别日期之间增删的ID 将 ID 添加到另一个数据帧以及添加删除的日期 date ID value 12 31 2010 13 0 124409 9 0 555959 1 0 7
Scrapy：如何使用元在方法之间传递项目

我是 scrapy 和 python 的新手我试图将 parse quotes 中的项目 item author 传递给下一个解析方法 parse bio 我尝试了 request meta 和 response meta 方法如 sc
Rocket UniData/UniVerse：ODBC 无法分配足够的内存

每当我尝试使用pyodbc连接到 Rocket UniData UniVerse 数据时我不断遇到错误 pyodbc Error 00000 00000 Rocket U2 U2ODBC 0302810 Unable to allocate
Statsmodels.formula.api OLS不显示截距的统计值

我正在运行以下源代码 import statsmodels formula api as sm Add one column of ones for the intercept term X np append arr np ones 50

随机推荐

当汇总为双精度时，从 ForEach 循环转换为 Parallel.ForEach 循环会减慢速度

我有一段 C 代码如下此代码总结了 DataTable 中的一列双精度 var data this Db ExecuteRead query this Score Name var time 0 0 foreach DataRow ro
Android Appwidget textview不更新

你好我的 Android 小部件遇到了一个非常奇怪的问题我广泛查看了很多地方但我似乎无法弄清楚出了什么问题基本上我在我的小部件中调用待定意图广播并在 onrecivie 方法中成功捕获该意图但是在 onRecive 方法中当
python子进程隐藏stdout并等待它完成

我有这个代码 def method a self command line somtoolbox GrowingSOM som prop path subprocess Popen shlex split command line def
Visual Studio 2017 调试错误：为了防止在评估函数 *.toString 时发生不安全中止，允许所有线程运行

我将 Visual Studio 2017 更新到版本 15 8 2 这次更新之后我在调试时开始遇到这些错误以下是错误消息 Visual Studio 调试错误为了防止在评估函数 toString 时发生不安全中止允许所有线程运行
链接到 Github 上的另一个 html 页面

我试图寻找解决方案但不太确定如何在谷歌中以简洁的方式表达我的问题以获得解决方案我对 Html 和 github 相当陌生最近我用自己的 html 代码制作了自己的 Github 页面简而言之我在github中有一个文件 index
如何在 iOS 中禁用特定方向

我想在某些视图中禁用横向方向我已经重写了以下两个方法但这些方法不会随时调用 NSUInteger supportedInterfaceOrientations return UIInterfaceOrientationMaskPortr
Spring Boot 在 Apache 代理后面嵌入 Tomcat

我们有一个 Spring Boot Spring MVC 应用程序在 Apache SSL 代理后面的专用应用程序服务器上嵌入了 Tomcat 代理服务器上的 SSL 端口是 4433 转发到应用程序服务器上的端口 8080 所以代理服务
在 Python 中将文件从一个位置复制到另一个位置

我有一个名为fileList包含数千个文件名和大小如下所示 home rob Pictures some folder picture one something jpg 143452 home rob Pictures some oth
如何将文件保存到我的桌面文件夹 Angular 6

我已经从base64构建了一个文件我想将其保存到本地系统 dataURLtoFile dataurl filename format const arr dataurl split const mime arr 0 match 1 con
根据模板参数创建字符串

I have many像这样的类方法 template
如何从 NSMutableArray 中删除 NULL 值？ IOS

我有一个生日数组因为数组是从 facebook 填充的所以有一些朋友的生日是私有的所以它包含 NULL 如何将该数组转换为空字符串只要存在 null 值数组如下所示
在 ASP.NET 中构建动态“高级搜索”控件的建议

替代文本 http img3 imageshack us img3 1488 advancedsearch png http img3 imageshack us img3 1488 advancedsearch png 我正在 ASP N
如何修复 Git 中的“packet_write_wait：连接到...损坏的管道”错误

当我git push文件发送到我的远程存储库它会抛出错误 packet write wait 连接到 13 250 177 223 端口 22 管道损坏之前git push 我已经从远程克隆了该项目并且git add git commi
正确设置 IIS7.5 机器帐户以进行匿名网站访问

使用 IIS 7 5 IIS IUSRS 应该是要使用的帐户我收到 401 未经授权由于凭据无效访问被拒绝错误如果我添加一个带有 Read 的 EVERYONE 帐户它就可以工作但最好不要拥有Everyone 帐户知道为什么
C++ 隐式进入/启动主要可执行错误

我在 Mac 上运行 Hadoop 管道代码时遇到问题这是我的 C 代码 include
一起使用 ASP.Net AJAX 和 JQuery 的任何缺点

我们计划使用 jQuery 库来增强我们的客户端 JavaScript 需求尝试同时使用 ASP Net AJAX 和 jQuery 时是否存在任何重大问题这两个库似乎都将用于特殊目的有什么冲突是我们需要注意的吗我们还使用使用 A
如何在 C# 中将泛型对象分配给非泛型引用

我是一名 Java 人员正在尝试用 C 实现一些代码我研究了一个小时但没有找到任何东西我有一个声明为通用的接口称为 interface TypeSerializer
在 Python 正则表达式中使用 ^ 匹配行首

我正在尝试从 Thomson Reuters Web of Science 中提取出版年份 ISI 风格的数据出版年份的行看起来像这样在行的最开头 PY 2015 对于我正在编写的脚本我定义了以下正则表达式函数 import re
我的 C 程序如何检查它是否对给定文件具有执行权限？

有没有办法判断进程是否may执行文件而不必实际执行它例如通过调用execv filepath args 只是失败并发现errno EACCES I could stat文件并观察st mode 但我仍然不知道这与这个过程有什么关系理想情
groupby pandas 数据帧上的算术运算

我有一个包含 40 列和 400000 行的 pandas 数据框我创建了一个包含 3 列的汇总数据集现在我需要根据其中两列计算百分比指标 Python 抛出错误 unsupported operand type s for Seri

groupby pandas 数据帧上的算术运算

groupby pandas 数据帧上的算术运算 的相关文章

随机推荐

热门标签

groupby pandas 数据帧上的算术运算的相关文章