根据上一行中的值进行分组

2024-01-30

我有一列包含值列表，如下所示：

我想做一个Groupby（或类似的有效构造）以获取每行值在范围内的批量行100最后一行的。

在这种情况下，上面示例中生产的批次将是

100, 200, 300,

500, 600, 650

1000

这可以在 Pandas 中做到吗？由于 Pandas 尝试允许类似 SQL 的查询，我猜它应该是这样。

您可以使用类似于答案中描述的方法这个问题 https://stackoverflow.com/questions/14358567/finding-consecutive-segments-in-a-pandas-data-frame。这基本上是一个三步过程：

Use shift计算要区分的行间标准。
Use cumsum将此标准相加，创建一个新系列，其中每个组具有单个值的单独“块”。
小组讨论这个新系列。

这是一个例子：

>>> x = pandas.Series([100, 200, 300, 500, 600, 650, 1000, 900, 750])
>>> x.groupby(((x - x.shift()).abs() > 100).cumsum()).apply(list)
0    [100, 200, 300]
1    [500, 600, 650]
2        [1000, 900]
3              [750]
dtype: object

请注意，我使用了标准> 100，这与<= 100你提到的标准。使用这种方法，您需要使用以下标准：分离组，而不是加入它们的标准，因此您必须使用分组标准的否定。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

groupby

根据上一行中的值进行分组的相关文章

Celery 任务分析

正如我所看到的top公用事业celery进程消耗大量CPU时间所以我想介绍一下它我可以在开发人员机器上手动执行此操作如下所示 python m cProfile o test date Y m d T prof manage py c
R 的 ggplot2 有 Python API 吗？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我的问题就像标题一样简单我想使用R s ggplot2但我所有的数据处理都是在Python 有没有Py
如何在seaborn.objects API中移动图例位置

我正在使用新的seaborn objects https seaborn pydata org api html objects interfaceAPI 在 v0 12 0 中可用没有任何一个examples https seaborn
从 Robot Framework 访问 python 类的变量

我有一个 python 文件例如 Animals py 在里面我定义了 3 个不同的类如下所示 Animals py class Animal listAnimal dog cat lt def init self Animal con
通过 Scrapy 抓取 Google Analytics

我一直在尝试使用 Scrapy 从 Google Analytics 获取一些数据尽管我是一个完全的 Python 新手但我已经取得了一些进展我现在可以通过 Scrapy 登录 Google Analytics 但我需要发出 AJAX
将 saxon 与 python 结合使用

我需要使用 python 处理 XSLT 目前我正在使用仅支持 XSLT 1 的 lxml 现在我需要处理 XSLT 2 有没有办法将 saxon XSLT 处理器与 python 一起使用有两种可能的方法设置一个 HTTP 服务接受
将 Matplotlib 误差线放置在不位于条形中心的位置

我正在 Matplotlib 中生成带有错误栏的堆积条形图不幸的是某些层相对较小且数据多样因此多个层的错误条可能重叠从而使它们难以或无法读取 Example 有没有办法设置每个误差条的位置即沿 x 轴移动它以便重叠的线显示在彼此
OpenCV Python cv2.mixChannels()

我试图将其从 C 转换为 Python 但它给出了不同的色调结果 In C Transform it to HSV cvtColor src hsv CV BGR2HSV Use only the Hue value hue create
使用带有关键字参数的 map() 函数

这是我尝试使用的循环map功能于 volume ids 1 2 3 4 5 ip 172 12 13 122 for volume id in volume ids my function volume id ip ip 我有办法做到这一点
Python - StatsModels、OLS 置信区间

在 Statsmodels 中我可以使用以下方法拟合我的模型 import statsmodels api as sm X np array 22000 13400 47600 7400 12000 32000 28000 31000 6
PyUSB 1.0：NotImplementedError：此平台不支持或未实现操作

我刚刚开始使用 pyusb 基本上我正在玩示例代码here https github com walac pyusb blob master docs tutorial rst 我使用的是 Windows 7 64 位并从以下地址下载 z
如何替换 pandas 数据框列中的重音符号

我有一个数据框dataSwiss其中包含瑞士城市的信息我想用普通字母替换带有重音符号的字母这就是我正在做的 dataSwiss Municipality dataSwiss Municipality str encode utf 8 d
是否可以忽略一行的pyright检查？

我需要忽略一行的pyright 检查有什么特别的评论吗 def create slog group SLogGroup data Optional dict None SLog insert one SLog group group da
Python pickle：腌制对象不等于源对象

我认为这是预期的行为但想检查一下也许找出原因因为我所做的研究结果是空白我有一个函数可以提取数据创建自定义类的新实例然后将其附加到列表中该类仅包含变量然后我使用协议 2 作为二进制文件将该列表腌制到文件中稍后我重新运行脚本
如何使用Python创建历史时间线

So I ve seen a few answers on here that helped a bit but my dataset is larger than the ones that have been answered prev
IO 密集型任务中的 Python 多线程

建议仅在 IO 密集型任务中使用 Python 多线程因为 Python 有一个全局解释器锁 GIL 只允许一个线程持有 Python 解释器的控制权然而多线程对于 IO 密集型操作有意义吗 https stackoverflow c
python获取上传/下载速度

我想在我的计算机上监控上传和下载速度一个名为 conky 的程序已经在 conky conf 中执行了以下操作 Connection quality alignr wireless link qual perc wlan0 downspe
使用 \r 并打印一些文本后如何清除控制台中的一行？

对于我当前的项目有一些代码很慢并且我无法使其更快为了获得一些关于已完成必须完成多少的反馈我创建了一个进度片段您可以在下面看到当你看到最后一行时 sys stdout write r100 80 n I use 80覆盖最终剩余的
Pandas：merge_asof() 对多行求和/不重复

我正在处理两个数据集每个数据集具有不同的关联日期我想合并它们但因为日期不完全匹配我相信merge asof 是最好的方法然而有两件事发生merge asof 不理想的数字重复数字丢失以下代码是一个示例 df a pd Da
Jupyter Notebook 内核一直很忙

我已经安装了 anaconda 并且 python 在 Spyder IPython 等中工作正常但是我无法运行 python 笔记本内核被创建它也连接但它始终显示黑圈忙碌符号防火墙或防病毒软件没有问题我尝试过禁用两者我也无法

随机推荐

WebView 无法在 Android 模拟器中工作

我创建了一个带有简单 Web 视图的 Android 项目我正在尝试打开谷歌但模拟器屏幕显示 Google 不可用我已在清单文件中添加了互联网权限即使我也可以从模拟器浏览器访问谷歌仅在应用程序中我无法访问日志中也没有打印任何内
有没有办法从 UIView 捕获 WillRotateToInterfaceOrientation 事件？

每个 UIViewController 都有一个名为 willRotateToInterface 的方法是否也可以在 UIView 中执行此操作这符合模型视图控制器的想法吗我能想到的唯一方法是将事件从 UIViewController
触发事件时“法师注册表项已存在”

我目前正在尝试连接 sales order save after 事件但在触发该事件时不断收到以下错误 Mage registry key singleton Modulename Orderobserver already exists
smarty tpl 中的 jquery

smarty tpl 中的 jquery 尝试使用 jquery 插入类属性以便我可以使用阴影对每个其他列表项行进行 CSS 样式下面的代码似乎应该可以工作但是 alt 类没有插入到 li 标记中页面加载良好没有任何问题有人看到
快速 C 随机布尔生成器

我对在 C 中生成快速随机布尔值或等效的 Bernoulli 0 5 随机变量感兴趣当然如果有一个具有良好统计行为的快速随机生成器那么对随机 Bernoulli 0 5 进行采样的问题很容易已解决样本x统一在 0 1 并返回
使用 Javascript 打印到默认打印机，无需打开 html 中的打印机确认对话框

在 html 文件中单击按钮打印特定 div 无需打开打印机确认弹出对话框会自动打印该内容这实际上不可能以所有人都支持的方式进行modern浏览器这是有充分理由的您不希望随机网站在没有您干预的情况下开始打印内容
我可以使用 JSON 数据在 Django 中添加新对象吗？

我有一组已知的 JSON 数据这些数据是从 Excel 文件中提取的我想将其添加到我的 Django 应用程序中格式如下 Record 12345 Event Initial task completed TeamID 12345 I
WPF 错误的 KeyDown ASCII 代码

我需要根据以下内容获取键盘按键的数值ASCII 表 http www asciitable com 由于 WPF 没有内置解决方案我尝试了几种技巧 1 这仅给出大写值 char res Char TryParse e Key ToStri
如何使用Java11解决“无法访问类型com.sun.crypto.provider.SunJCE”？

我正在尝试将我的应用程序从 Java 8 迁移到 Java 11 在我的一个项目类中我有以下行Security addProvider new com sun crypto provider SunJCE 我收到此行的编译错误如何解决这
每次使用后不关闭 DefaultHttpClient() 的解决方法

每次我执行 Http 请求时都会调用此方法 private JSONObject getRequest HttpUriRequest requestType httpClient new DefaultHttpClient Creating
如何在 Material UI 对话框标题的右上角添加关闭图标？

我想在右上角的标题部分添加关闭图标我正在使用材质 UI 对话框一切工作正常但我想要顶部的关闭按钮如图所示我知道这是在 Material UI V1 之前被问到的但接受的答案适用于 Material UI 版本 0 或他们所说的任
@font-face 根本不起作用

我不明白这里发生了什么因为当我自己拥有这段代码时它正在工作在 FireFox 中 font face font family mmfont src url scripts mmfont ttf format truetype font
获取名称列表中最长的名称

一个例子是这样的 def get longest name a list count 0 for i in a list if len i gt count count len i word i return word def main p
你能列出一个 tidyselect `everything()` 的例外吗

library tidyverse iris gt as tibble gt select everything gt A tibble 150 x 5 gt Sepal Length Sepal Width Petal Length Pe
是否可以在不定义任何关联的情况下映射实体中的字段？

我在数据库中有以下模式简化 MainTable ID primary key SOMEFIELD CODE FK1 references OtherTable1 CODE without declared foreign key CODE
在 Javascript 中维护对页面刷新时弹出窗口的引用

有谁知道是否有一种方法可以在刷新页面后维护对弹出窗口的引用以便您可以继续访问它我最初的想法是用 JSON 对引用变量进行字符串化将其存储在 cookie 中并在页面刷新后对其进行 eval 但我还没有机会测试它我走在正确的轨道上吗
如何将Python模块拆分为多个文件？

我有一个 Python 模块其中包含 3 个类 A A1 和 A2 A1 和 A2 派生自 A A 包含对 A1 和 A2 进行操作的函数当它位于一个 py 文件中时这一切都工作正常但该文件已经变得相当长我想将 A1 和 A2 分
使用 apache 命令行运行带有空格参数值的命令

我正在使用 apache 命令行库我想从 java 程序执行 git stash list format gd at B grep some text with space 这是代码 commandLine addArgument gre
AppCenter 构建错误“配置配置文件不包括签名证书 Apple 推送服务”

当我尝试使用 appcenter 构建用于构建 ipa 的管道时出现错误配置文件 CloodVoteAdhoc 不包括签名证书 Apple Push Services com optiknights cloodvote 不过我添加了包
根据上一行中的值进行分组

我有一列包含值列表如下所示 100 200 300 500 600 650 1000 我想做一个Groupby 或类似的有效构造以获取每行值在范围内的批量行100最后一行的在这种情况下上面示例中生产的批次将是 100 200 300

根据上一行中的值进行分组

根据上一行中的值进行分组 的相关文章

随机推荐

热门标签

根据上一行中的值进行分组的相关文章