将最后一行除以组的第一行

2024-05-06

我有一个如下所示的数据框：

ID  Quantity Time
54  100      2020-01-01 00:00:05
54  87       2020-01-01 00:00:06
58  400      2020-01-01 00:00:08
58  390      2020-01-01 00:00:14
...

我已经按 ID 对数据帧进行了分组，并且只获取每个 ID 的第一个和最后一个值。

g = df.groupby('ID')

(pd.concat([g.head(1), g.tail(1)])
   .drop_duplicates()
   .sort_values('ID')
   .reset_index(drop=True))

现在，我想将每个 ID 最后一行的数量除以第一行的数量，并将其保存到仅最后一个条目的“结果”列中。

结果 df 应如下所示：

ID  Quantity  Time                  Result
54  100       2020-01-01 00:00:05   
54  87        2020-01-01 00:00:06   0.87
58  400       2020-01-01 00:00:08
58  390       2020-01-01 00:00:14   0.975

谢谢你的帮助！

如果总有成对的ID您可以通过索引选择所有对行[1::2]并除以移位值Series.shift http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.shift.html:

df['Result'] = df['Quantity'].iloc[1::2].div(df['Quantity'].shift())
print (df)
   ID  Quantity                 Time  Result
0  54       100  2020-01-01 00:00:05     NaN
1  54        87  2020-01-01 00:00:06   0.870
2  58       400  2020-01-01 00:00:08     NaN
3  58       390  2020-01-01 00:00:14   0.975

与小组合作的解决方案：

另一个想法是使用GroupBy.transform http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.core.groupby.GroupBy.transform.html with GroupBy.first http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.core.groupby.GroupBy.first.html并除以最后一个值ID by DataFrame.drop_duplicates http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.drop_duplicates.html:

first = df.groupby('ID')['Quantity'].transform('first')
df['Result'] = df.drop_duplicates('ID', keep='last')['Quantity'].div(first)
print (df)
   ID  Quantity                 Time  Result
0  54       100  2020-01-01 00:00:05     NaN
1  54        87  2020-01-01 00:00:06   0.870
2  58       400  2020-01-01 00:00:08     NaN
3  58       390  2020-01-01 00:00:14   0.975

或者使用 lambda 函数并替换为NaN by Series.mask http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.mask.html:

df['Result'] = (df.groupby('ID')['Quantity'].transform(lambda x: x.iat[-1] / x.iat[0])
                  .mask(df['ID'].duplicated(keep='last')))
print (df)

   ID  Quantity                 Time  Result
0  54       100  2020-01-01 00:00:05     NaN
1  54        87  2020-01-01 00:00:06   0.870
2  58       400  2020-01-01 00:00:08     NaN
3  58       390  2020-01-01 00:00:14   0.975

如果至少有一组具有独特的ID?

print (df)
   ID  Quantity                 Time
0  54       100  2020-01-01 00:00:05
1  58       400  2020-01-01 00:00:08
2  58       390  2020-01-01 00:00:14

#failed
df['Result1'] = df['Quantity'].iloc[1::2].div(df['Quantity'].shift())
#working correct
first = df.groupby('ID')['Quantity'].transform('first')
df['Result2'] = df.drop_duplicates('ID', keep='last')['Quantity'].div(first)
#working correct
df['Result3'] = (df.groupby('ID')['Quantity'].transform(lambda x: x.iat[-1] / x.iat[0])
                  .mask(df['ID'].duplicated(keep='last')))
print (df)
   ID  Quantity                 Time  Result1  Result2  Result3
0  54       100  2020-01-01 00:00:05      NaN    1.000    1.000
1  58       400  2020-01-01 00:00:08      4.0      NaN      NaN
2  58       390  2020-01-01 00:00:14      NaN    0.975    0.975

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

将最后一行除以组的第一行的相关文章

Django 管理员在模型编辑时间歇性返回 404

我们使用 Django Admin 来维护导出到我们的一些站点的一些数据有时当单击标准更改列表视图来获取模型编辑表单而不是路由到正确的页面时我们会得到 Django 404 页面模板它是偶尔发生的我们可以通过重新加载三次来重现它
通过最小元素比较对 5 个元素进行排序

我必须在 python 中使用元素之间的最小比较次数来建模对 5 个元素的列表进行排序的执行计划除此之外复杂性是无关紧要的结果是一个对的列表表示在另一时间对列表进行排序所需的比较我知道有一种算法可以通过 7 次比较总是在元素之间
使用带有关键字参数的 map() 函数

这是我尝试使用的循环map功能于 volume ids 1 2 3 4 5 ip 172 12 13 122 for volume id in volume ids my function volume id ip ip 我有办法做到这一点
Python - StatsModels、OLS 置信区间

在 Statsmodels 中我可以使用以下方法拟合我的模型 import statsmodels api as sm X np array 22000 13400 47600 7400 12000 32000 28000 31000 6
Flask 会话变量

我正在用 Flask 编写一个小型网络应用程序当两个用户在同一网络下尝试使用应用程序时我遇到会话变量问题这是代码 import os from flask import Flask request render template
如何使用Conda下载python包并随后离线安装？

我知道通过 pip 我可以使用以下命令下载 Python 包但 pip install 破坏了我的内部包依赖关系当我做 pip download
绘制随时间变化的分类数据计数

我有一个数据框 df 其中有一列包含分类数据 ETH 带有 DateTimeIndex 我想绘制类别counts随着时间的推移它们按天索引我最好按年绘制它们 df pd DataFrame County 0 Bexar 3 Nueces
根据列值突出显示数据框中的行？

假设我有这样的数据框 col1 col2 col3 col4 0 A A 1 pass 2 1 A A 2 pass 4 2 A A 1 fail 4 3 A A 1 fail 5 4 A A 1 pass 3 5 A A 2 fail 2
以编程方式停止Python脚本的执行？ [复制]

这个问题在这里已经有答案了是否可以使用命令在任意行停止执行 python 脚本 Like some code quit quit at this point some more code that s not executed sys e
OpenCV 无法从 MacBook Pro iSight 捕获

几天后我无法再从 opencv 应用程序内部打开我的 iSight 相机 cap cv2 VideoCapture 0 返回并且cap isOpened 回报true 然而 cap grab 刚刚返回false 有任何想法吗示例代码
如何加速Python中的N维区间树？

考虑以下问题给定一组n间隔和一组m浮点数对于每个浮点数确定包含该浮点数的区间子集这个问题已经通过构建一个解决区间树 https en wikipedia org wiki Interval tree 或称为范围树或线段树已经针对一
添加不同形状的 numpy 数组

我想添加两个不同形状的 numpy 数组但不进行广播而是将缺失值视为零可能最简单的例子是 1 2 3 2 gt 3 2 3 or 1 2 3 2 1 gt 3 2 3 1 0 0 我事先不知道形状我正在弄乱每个 np shape
Python 的“zip”内置函数的 Ruby 等价物是什么？

Ruby 是否有与 Python 内置函数等效的东西zip功能如果不是做同样事情的简洁方法是什么一些背景信息当我试图找到一种干净的方法来进行涉及两个数组的检查时出现了这个问题如果我有zip 我可以写这样的东西 zip a b a
在Python中获取文件描述符的位置

比如说我有一个原始数字文件描述符我需要根据它获取文件中的当前位置 import os psutil some code that works with file lp lib open path to file p psutil Pro
在f字符串中转义字符[重复]

这个问题在这里已经有答案了我遇到了以下问题f string gt gt gt a hello how to print hello gt gt gt f a a gt gt gt f a File
使用 \r 并打印一些文本后如何清除控制台中的一行？

对于我当前的项目有一些代码很慢并且我无法使其更快为了获得一些关于已完成必须完成多少的反馈我创建了一个进度片段您可以在下面看到当你看到最后一行时 sys stdout write r100 80 n I use 80覆盖最终剩余的
向 Altair 图表添加背景实心填充

I like Altair a lot for making graphs in Python As a tribute I wanted to regenerate the Economist graph s in Mistakes we
Python：如何将列表列表的元素转换为无向图？

我有一个程序可以检索 PubMed 出版物列表并希望构建一个共同作者图这意味着对于每篇文章我想将每个作者如果尚未存在添加为顶点并添加无向边或增加每个合著者之间的权重我设法编写了第一个程序该程序检索每个出版物的作者列表并
Scrapy：如何使用元在方法之间传递项目

我是 scrapy 和 python 的新手我试图将 parse quotes 中的项目 item author 传递给下一个解析方法 parse bio 我尝试了 request meta 和 response meta 方法如 sc
Rocket UniData/UniVerse：ODBC 无法分配足够的内存

每当我尝试使用pyodbc连接到 Rocket UniData UniVerse 数据时我不断遇到错误 pyodbc Error 00000 00000 Rocket U2 U2ODBC 0302810 Unable to allocate

随机推荐

获取带有注释的所有类并将它们添加到 android 中的 hashMap

我不确定这是否可能但我基本上希望能够轻松地将新项目添加到列表中只需添加带有特殊注释的类即可我能想到的唯一例子就是我目前正在做的事情用户可以完成很多挑战目前我的应用程序中有一个用于挑战的包我希望能够在该包中创建一个新类给它
来自函数参数的动态 Typescript 对象属性

我有一个函数它接受一个n参数的数量并生成一个新对象其中包含参数到唯一哈希的键值映射 Typescript 有没有办法从函数的参数动态推断返回对象的键 Example 生成字典的CreateActionType函数 function c
使用 qtp 功能单击特定链接

我想通过创建一个在操作中调用的函数来自动执行 Flipkart 的登录过程 Function Website this is the function Systemutil Run iexplore exe http www flipkar
VBA写入Word，更改字体格式

我正在 Excel 中编写 VBA 脚本以将基于某些表格的文本输出到 Word 文档在大多数情况下一切都很顺利我在 stackoverflow 的帮助下自学我有一个相当长的代码因此将其全部复制到这里会很困难我将尝试展示相关部分
时间序列数据 - 如何[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我正在考虑进行一项为期一个月的研究受试者记录他的饮酒量和排尿频率我想让受试者每天记录这些活动这样我就有一个月的数据每天的排尿次
Kubernetes Pod 动态环境变量

我需要能够将自定义环境变量分配给 Pod 的每个副本一个变量应该是一些随机的 uuid 另一个唯一的数字怎么可能实现呢我更愿意继续使用带有副本的部署如果这不是开箱即用的如何通过自定义复制控制器控制器管理器来实现有没有可用的钩
使用 SESSION_CONTEXT 的实体框架核心行级安全性

我正在使用 ASP NET Core 和 Entity Framework 7 Core 编写一个使用行级安全性的多租户应用程序由于我的数据库托管在 Microsoft SQL Server 上因此我使用了this https msdn
Facebook 点赞按钮点赞错误的网址

如果我尝试制作一个 facebook like 按钮来喜欢以下网址 http go style co uk nggallery page 7029 image 35 该按钮喜欢以下网址 http go style co uk test ga
如何以编程方式创建证书签名请求 (CSR)？

如何用C实现呢 openssl req new key cert key out cert csr openssl x509 req in cert csr CA rootCA crt CAkey rootCA key CAcreatese
Monolog Logger 在每个日志消息的末尾输出空数组

我的记录器对象在每行末尾输出空数组例如 2017 08 17 12 26 02 import log INFO checkForDuplicates is processing 2017 08 17 12 26 04 import log
如何使用 JavaFX 中的 JCSG 库将 MeshView 转换为 CSG 对象

我正在使用 JavaFX 的 JCSG 库我有一些MeshView我想将它们转换成的对象CSG对象有办法实现吗最简单的方法是组合javafx scene shape Mesh对象与 CSG 对象前提是您有TriangleMesh正在
BlackBerry - 带居中位图的 ButtonField

我有一个从 ButtonField 扩展的类 class BitmapButtonField extends ButtonField private Bitmap bitmap private int buttonWidth private
XML 序列化基类列表

我有课A从类继承B 我有一个班级名单B其中包含A and B items List b myList new List b myList Add new A 当我尝试使用序列化此列表时XmlSerializable 抛出异常如果我将列表定
Doctrine/Symfony 如何使用数组中的特定数据更新实体

我环顾四周太久了但没有运气我的情况是我有一个有点大的表 60 列在 Doctrine Entity 中表示在 FosREST 上工作我想要实现的是我想发送带有特定数据的 JSON 例如 phone gt new phone n
一项活动中有多个 YouTube 玩家

我正在使用 Youtube Android Player API 如下所述 https developers google com youtube android player https developers google com you
基于现有数据库表创建@TableVariable？

我想在存储过程中使用表变量但这是一个问题我的表非常大声明表变量也需要很长的代码来编写和调试请告诉我一些快速声明表变量的方法是否可以基于现有表创建表变量或者请分享任何创建用于创建表变量的代码的提示 Thanks 右键单击表格选择
Java 8 Streams - 按层次结构对嵌套列表进行排序

给出以下示例我想要一个对列表和嵌套列表进行排序的流函数 class Foo public int sort public List
如何在onSaveInstanceState中使用变量[重复]

这个问题在这里已经有答案了我刚刚开始在 android 上学习编程并且在使用变量时遇到问题onSaveInstanceState 这是我的代码 int resultCode Override public void onCreate B
Python：代码统计

你知道是否有一个可以生成代码统计信息的 Python 库吗我正在考虑指向一个包并获取类函数方法文档块行等的数量它最终可能会包含无用的东西例如 lambda 的数量或其他疯狂的统计数据只是为了好玩人们通常不会用十几两行代码就能
将最后一行除以组的第一行

我有一个如下所示的数据框 ID Quantity Time 54 100 2020 01 01 00 00 05 54 87 2020 01 01 00 00 06 58 400 2020 01 01 00 00 08 58 390 202

将最后一行除以组的第一行

将最后一行除以组的第一行 的相关文章

随机推荐

热门标签

将最后一行除以组的第一行的相关文章