Pandas 中的条件运行总和仅适用于所有先前的值

2023-12-14

假设我有以下数据框：

df = pd.DataFrame({'Event': ['A', 'B', 'A', 'A', 'B', 'C', 'B', 'B', 'A', 'C'], 
                   'Date': ['2019-01-01', '2019-02-01', '2019-03-01', '2019-03-01', '2019-02-15', 
                             '2019-03-15', '2019-04-05', '2019-04-05', '2019-04-15', '2019-06-10'],
                   'Sale': [100, 200, 150, 200, 150, 100, 300, 250, 500, 400]})
df['Date'] = pd.to_datetime(df['Date'])
df

Event         Date  Sale
    A   2019-01-01   100
    B   2019-02-01   200
    A   2019-03-01   150
    A   2019-03-01   200
    B   2019-02-15   150
    C   2019-03-15   100
    B   2019-04-05   300
    B   2019-04-05   250
    A   2019-04-15   500
    C   2019-06-10   400

我想获得以下结果：

Event         Date  Sale   Total_Previous_Sale
    A   2019-01-01   100                     0
    B   2019-02-01   200                     0
    A   2019-03-01   150                   100
    A   2019-03-01   200                   100
    B   2019-02-15   150                   200
    C   2019-03-15   100                     0
    B   2019-04-05   300                   350
    B   2019-04-05   250                   350
    A   2019-04-15   500                   450
    C   2019-06-10   400                   100

where df['Total_Previous_Sale']是销售总额（df['Sale']）当事件（df['Event']) 发生在其相邻日期 (df['Date']）。例如，

2019-01-01之前事件A的销售总额为0，
2019-03-01之前事件A的销售总额为100，并且
2019年4月15日之前事件A的销售总额为100 + 150 + 200 = 450。

基本上，它与条件累积和几乎相同，但仅适用于所有先前值（不包括当前值）。我能够使用这一行获得所需的结果：

df['Sale_Total'] = [df.loc[(df['Event'] == df.loc[i, 'Event']) & (df['Date'] < df.loc[i, 'Date']), 
                           'Sale'].sum() for i in range(len(df))]

虽然速度很慢，但效果很好。我相信有更好更快的方法来做到这一点。我已经尝试过这些行：

df['Total_Previuos_Sale'] = df[df['Date'] < df['Date']].groupby(['Event'])['Sale'].cumsum()

df['Total_Previuos_Sale'] = df.groupby(['Event'])['Sale'].shift(1).cumsum().fillna(0)

但它会产生 NaN 或产生不需要的结果。

第一聚合sum per Event and Date for MultiIndex，然后按第一级分组Event并使用shift带有 lambda 函数和最后的累积和join一起：

s = (df.groupby(['Event', 'Date'])['Sale']
       .sum().groupby(level=0)
       .apply(lambda x: x.shift(1).cumsum())
       .fillna(0)

df = df.join(s.rename('Total_Previuos_Sale'), on=['Event','Date'])
print (df)
  Event        Date  Sale  Total_Previuos_Sale
0     A  2019-01-01   100                  0.0
1     B  2019-02-01   200                  0.0
2     A  2019-03-01   150                100.0
3     A  2019-03-01   200                100.0
4     B  2019-02-15   150                200.0
5     C  2019-03-15   100                  0.0
6     B  2019-04-05   300                350.0
7     B  2019-04-05   250                350.0
8     A  2019-04-15   500                450.0
9     C  2019-06-10   400                100.0

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

GROUPING

cumulativesum

Pandas 中的条件运行总和仅适用于所有先前的值的相关文章

如何生成给定范围内的回文数列表？

假设范围是 1 X 120 这是我尝试过的 gt gt gt def isPalindrome s check if a number is a Palindrome s str s return s s 1 gt gt gt def ge
如何使用 Scrapy 从网站获取所有纯文本？

我希望在 HTML 呈现后可以从网站上看到所有文本我正在使用 Scrapy 框架使用 Python 工作和xpath body text 我能够获取它但是带有 HTML 标签而且我只想要文本有什么解决办法吗最简单的选择是ext
为 pandas 数据透视表中的每个值列定义 aggfunc

试图生成具有多个值列的数据透视表我知道我可以使用 aggfunc 按照我想要的方式聚合值但是如果我不想对两列求和或求平均值而是想要一列的总和同时求另一列的平均值该怎么办那么使用 pandas 可以做到这一点吗 df pd D
Python tcl 未正确安装

我刚刚为 python 安装了graphics py 但是当我尝试运行以下代码时 from graphics import def main win GraphWin My Circle 100 100 c Circle Point 50
在循环中每次迭代开始时将变量重新分配给原始值（在循环之前定义）

在Python中你使用在每次迭代开始时将变量重新分配给原始值在循环之前定义时也就是说 original 1D o o o for i in range 0 3 new original 1D revert back to orig
在 NumPy 中获取 ndarray 的索引和值

我有一个 ndarrayA任意维数N 我想创建一个数组B元组数组或列表其中第一个N每个元组中的元素是索引最后一个元素是该索引的值A 例如 A array 1 2 3 4 5 6 Then B 0 0 1 0 1 2 0 2 3 1 0
使用 Pycharm 在 Windows 下启动应用程序时出现 UnicodeDecodeError

问题是当我尝试启动应用程序 app py 时我收到以下错误 UnicodeDecodeError utf 8 编解码器无法解码位置 5 中的字节 0xb3 起始字节无效整个文件app py coding utf 8 from flask
python pandas 中的双端队列

我正在使用Python的deque 实现一个简单的循环缓冲区 from collections import deque import numpy as np test sequence np array range 100 2 resha
在pyyaml中表示具有相同基类的不同类的实例

我有一些单元测试集希望将每个测试运行的结果存储为 YAML 文件以供进一步分析 YAML 格式的转储数据在几个方面满足我的需求但测试属于不同的套装结果有不同的父类这是我所拥有的示例 gt gt gt rz shorthand for
Abaqus 将曲面转化为集合

我一直试图在模型中找到两个表面的中心参见照片但未能成功它们是元素表面面查询中没有选项可以查找元素表面的中心只能查找元素集的中心找到节点集的中心也很好但是我的节点集没有出现在工具 gt 查询 gt 质量属性选项中而且我找不到
Python：字符串不会转换为浮点数[重复]

这个问题在这里已经有答案了我几个小时前写了这个程序 while True print What would you like me to double line raw input gt if line done break else f
Pandas Dataframe 中 bool 值的条件前向填充

问题如何转发 fill boolTruepandas 数据框中的值如果是当天的第一个条目 True 到一天结束时请参阅以下示例和所需的输出 Data import pandas as pd import numpy as np df
Python：尝试检查有效的电话号码

我正在尝试编写一个接受以下格式的电话号码的程序XXX XXX XXXX并将条目中的任何字母翻译为其相应的数字现在我有了这个如果启动不正确它将允许您重新输入正确的数字然后它会翻译输入的原始数字我该如何解决 def main phon
循环中断打破tqdm

下面的简单代码使用tqdm https github com tqdm tqdm在循环迭代时显示进度条 import tqdm for f in tqdm tqdm range 100000000 if f gt 100000000 4 b
Python - 在窗口最小化或隐藏时使用 pywinauto 控制窗口

我正在尝试做的事情我正在尝试使用 pywinauto 在 python 中创建一个脚本以在后台自动安装 notepad 隐藏或最小化 notepad 只是一个示例因为我将编辑它以与其他软件一起使用 Problem 问题是我想在安装程序
Python 3 中“map”类型的对象没有 len()

我在使用 Python 3 时遇到问题我得到了 Python 2 7 代码目前我正在尝试更新它我收到错误类型错误 map 类型的对象没有 len 在这部分 str len seed candidates 在我像这样初始化它之前 se
设置 torch.gather(...) 调用的结果

我有一个形状为 n x m 的 2D pytorch 张量我想使用索引列表来索引第二个维度可以使用 torch gather 完成然后然后还设置新值到索引的结果 Example data torch tensor 0 1 2 3 4
对输入求 Keras 模型的导数返回全零

所以我有一个 Keras 模型我想将模型的梯度应用于其输入这就是我所做的 import tensorflow as tf from keras models import Sequential from keras layers imp
Python：元类属性有时会覆盖类属性？

下面代码的结果让我感到困惑 class MyClass type property def a self return 1 class MyObject object metaclass MyClass a 2 print MyObject
PyAudio ErrNo 输入溢出 -9981

我遇到了与用户相同的错误 Python 使用 Pyaudio 以 16000Hz 录制音频时出错 https stackoverflow com questions 12994981 python error audio recording

随机推荐

根据 WordPress 中的类别显示最近的帖子

我使用一个在 content php 页面上生成缩略图的模板如下所示
如何在 Git 中将悬挂 blob 与文件名匹配？

我还有另一个做的例子git rm rf没有初始提交我意识到我添加了很多无用的文件并且想添加一些过滤器现在我只剩下 23000 个悬空的 blob 没有树但有完整的 Git 历史记录我将使用一个脚本来循环 blobnames 使用g
使用聚合子查询进行错误的查询评估

请参阅Factforge 端点执行此查询子查询不返回任何结果 myVar将被投影到包含查询然后与三元组模式连接 myVar p o 但由于内部选择没有结果因此联接应该不会产生任何结果但是执行查询时情况并非如此这不是一个bug吗
图像丢失且必需 - Wordpress AMP 结构不添加图像属性

使用 Google 的结构化数据测试工具验证我的 WordPress 帖子时出现以下错误 Image missing and required 我安装了官方 WordPress AMP 插件可以为我生成 AMP 页面问题是它不流行图
无法在android中使用videoview播放rtsp

我已经使用 VLC 设置了 RTSP 服务器然后我写一个应用程序这是我的代码 package com ashley work import android os Bundle import android app Activity im
如何获得像“http://stackoverflow.com/questions/1074/asp-mvc”这样的漂亮 URL

谁能帮我我正在 ASP NET MVC 中做一些测试我想将漂亮的 URL 实现为 stackoverflow com 路由系统例如 stackoverflow com questions 1074 asp mvc 域名 com id
如何将linux命令CURL转换为PHP

我想将这个linux命令控制台转换为PHP代码通过curl发送数据 curl X POST d data street 1 link Thanks fields 2 fields as string key value key2 valu
如何向IdentityServer DI框架注册ApplicationUserManager？

我正在使用 IdentityServer3 进行身份验证所有用户都存储在 Sql DB 中所以我也在使用Microsoft AspNet Identity实际身份验证的框架出于同样的目的我创建了自己的框架ApplicationUse
使用 MD5-SHA1 哈希算法进行 RSA 签名

据我所知 TLS 1 1 要求 CertificateVerify 消息的内容是使用两种哈希算法 MD5 和 SHA1 串联的数字签名值在 NET 中使用 RSACryptoServiceProvider 可以做到这一点吗这不起作用 u
如何将文本段设为只读？

我知道文本段是只读段尝试写入它会导致总线错误我很好奇这个段是如何变成只读的由于物理内存不是只读的因此必须在分页期间完成此操作内存的每个页面是否都有一个位用于为文本段设置的只读页面 ELF 文件 Unix 可执行文件或共享对象有
将双精度数限制为小数点后 3 位

这就是我想要实现的目标如果双精度数的小数位数超过 3 位我想截断第三位以外的所有小数位不要圆形 Eg 12 878999 gt 12 878 如果 double 的小数位数少于 3 位则保持不变 Eg 125 gt 125 89 2
_start 可以是拇指函数吗？

请帮助我使用arm926ejs cpu 的gnu 汇编器我尝试构建一个简单的程序 test S global start start mov r0 2 bx lr 并成功构建它 arm none linux gnueabi as mthu
Play Framework [2.4.x] 如何在子模块的路由文件中寻址公共资源

上一个问题可以作为当前讨论的子模块含义的基线 Play Framework 2 4 x 使用子模块如果您了解 Play 子模块那么在给定上下文的情况下如何输入子模块上的路由条目以公开公共文件夹中的资源每当我尝试创建基本条目
确保 MySQL 连接在 PHP 函数中正常工作

我有以下形式的代码这种类型代码不起作用因为 doSomething 没有与数据库的连接谁能解释为什么不呢我创建 con 连接before我调用 doSomething 那么为什么该函数表现得好像没有连接一样呢有什么方法可以解决
在不使用插件的情况下向 WooCommerce 订单号添加后缀和前缀

我想在不使用插件的情况下向 Woo Commerce 订单号添加后缀和前缀我尝试使用这个不起作用的钩子 add filter woocommerce order number my woocommerce order number 1 2
如何获取物理存储设备列表？

我想获取物理存储设备的列表我见过一些代码但实际上是循环的并且执行类似暴力的操作我想知道获取物理存储磁盘列表的一般方法是什么我发现了CreateFile 但我不明白如何正确使用它我需要一个非 wmi 解决方案如果不查询注册表就更
`UIDocument` 的 `save(to:for:completionHandler:)` 崩溃

我在运行 iOS 9 的每个 32 位设备模拟器上都会崩溃save to for completionHandler Xcode 8 2 基础 SDK 是 10 2 目标是9 0 标准架构 Swift 3 适用于开发和发布版本示例项目
javascript 错误 [对象 HTMLInputElement][对象 HTMLInputElement]

我正在练习 java 脚本代码但在实现此代码时遇到问题 Enter A
检查字典是否是另一个字典的子集的递归函数

我想递归地检查一本字典是否是另一本字典的子集我们假设两个字典都有内置类型作为项目我看到已经有一个很旧的线程了Python 检查一个字典是否是另一个较大字典的子集试图解决类似但不完全是的问题因为那里的答案都不符合我的目的所以我决定发布
Pandas 中的条件运行总和仅适用于所有先前的值

假设我有以下数据框 df pd DataFrame Event A B A A B C B B A C Date 2019 01 01 2019 02 01 2019 03 01 2019 03 01 2019 02 15 2019 03

Pandas 中的条件运行总和仅适用于所有先前的值

Pandas 中的条件运行总和仅适用于所有先前的值 的相关文章

随机推荐

热门标签

Pandas 中的条件运行总和仅适用于所有先前的值的相关文章