在 Pandas DataFrame 中界定值高于特定阈值的连续区域

2023-11-23

我有一个 Pandas Dataframe，其索引和值在 0 到 1 之间，如下所示：

 6  0.047033
 7  0.047650
 8  0.054067
 9  0.064767
10  0.073183
11  0.077950

我想检索元组超过 5 个连续值均超过某个阈值（例如 0.5）的区域的起点和终点。这样我就会有这样的东西：

 [(150, 185), (632, 680), (1500,1870)]

其中第一个元组属于从索引 150 开始的区域，有 35 个行中全部大于 0.5 的值，并以索引 185 结束（不包含）。

我首先只过滤大于 0.5 的值，如下所示

 df = df[df['values'] >= 0.5]

现在我有这样的价值观：

632  0.545700
633  0.574983
634  0.572083
635  0.595500
636  0.632033
637  0.657617
638  0.643300
639  0.646283

我无法显示我的实际数据集，但以下数据集应该是一个很好的表示

import numpy as np
from pandas import *

np.random.seed(seed=901212)

df = DataFrame(range(1,501), columns=['indices'])
df['values'] = np.random.rand(500)*.5 + .35

产量：

 1  0.491233
 2  0.538596
 3  0.516740
 4  0.381134
 5  0.670157
 6  0.846366
 7  0.495554
 8  0.436044
 9  0.695597
10  0.826591
...

其中区域 (2,4) 有两个大于 0.5 的值。然而这太短了。另一方面，连续有 19 个值高于 0.5 的区域 (25,44) 将被添加到列表中。

您可以通过查看系列和单行移位值来找到每个连续区域的第一个和最后一个元素，然后过滤彼此充分分开的对：

# tag rows based on the threshold
df['tag'] = df['values'] > .5

# first row is a True preceded by a False
fst = df.index[df['tag'] & ~ df['tag'].shift(1).fillna(False)]

# last row is a True followed by a False
lst = df.index[df['tag'] & ~ df['tag'].shift(-1).fillna(False)]

# filter those which are adequately apart
pr = [(i, j) for i, j in zip(fst, lst) if j > i + 4]

例如，第一个区域是：

>>> i, j = pr[0]
>>> df.loc[i:j]
    indices    values   tag
15       16  0.639992  True
16       17  0.593427  True
17       18  0.810888  True
18       19  0.596243  True
19       20  0.812684  True
20       21  0.617945  True

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

NumPy

pandas

在 Pandas DataFrame 中界定值高于特定阈值的连续区域的相关文章

将 saxon 与 python 结合使用

我需要使用 python 处理 XSLT 目前我正在使用仅支持 XSLT 1 的 lxml 现在我需要处理 XSLT 2 有没有办法将 saxon XSLT 处理器与 python 一起使用有两种可能的方法设置一个 HTTP 服务接受
如何使用Conda下载python包并随后离线安装？

我知道通过 pip 我可以使用以下命令下载 Python 包但 pip install 破坏了我的内部包依赖关系当我做 pip download
如何从网页中嵌入的 Tableau 图表中抓取工具提示值

我试图弄清楚是否有一种方法以及如何使用 python 从网页中的 Tableau 嵌入图形中抓取工具提示值以下是当用户将鼠标悬停在条形上时带有工具提示的图表示例我从要从中抓取的原始网页中获取了此网址 https covid19 colo
测试 python Counter 是否包含在另一个 Counter 中

如何测试是否是pythonCounter https docs python org 2 library collections html collections Counter is 包含在另一个中使用以下定义柜台a包含在计数器中b当且
以编程方式停止Python脚本的执行？ [复制]

这个问题在这里已经有答案了是否可以使用命令在任意行停止执行 python 脚本 Like some code quit quit at this point some more code that s not executed sys e
使用 Tkinter 显示 numpy 数组中的图像

我对 Python 缺乏经验第一次使用 Tkinter 制作一个 UI 显示我的数字分类程序与 mnist 数据集的结果当图像来自 numpy 数组而不是我的 PC 上的文件路径时我有一个关于在 Tkinter 中显示图像的问题我为
如何加速Python中的N维区间树？

考虑以下问题给定一组n间隔和一组m浮点数对于每个浮点数确定包含该浮点数的区间子集这个问题已经通过构建一个解决区间树 https en wikipedia org wiki Interval tree 或称为范围树或线段树已经针对一
从 Flask 访问 Heroku 变量

我已经使用以下命令在 Heroku 配置中设置了数据库变量 heroku config add server xxx xxx xxx xxx heroku config add user userName heroku config add
如何使用Python创建历史时间线

So I ve seen a few answers on here that helped a bit but my dataset is larger than the ones that have been answered prev
Pygame：有没有简单的方法可以找到按下的任何字母数字的字母/数字？

我目前正在开发的游戏需要让人们以自己的名义在高分板上计时我对如何处理按键有点熟悉但我只处理过寻找特定的按键有没有一种简单的方法可以按下任意键的字母而不必执行以下操作 for event in pygame event get if
使用 \r 并打印一些文本后如何清除控制台中的一行？

对于我当前的项目有一些代码很慢并且我无法使其更快为了获得一些关于已完成必须完成多少的反馈我创建了一个进度片段您可以在下面看到当你看到最后一行时 sys stdout write r100 80 n I use 80覆盖最终剩余的
Jupyter Notebook 内核一直很忙

我已经安装了 anaconda 并且 python 在 Spyder IPython 等中工作正常但是我无法运行 python 笔记本内核被创建它也连接但它始终显示黑圈忙碌符号防火墙或防病毒软件没有问题我尝试过禁用两者我也无法
如何在Python中对类别进行加权随机抽样

给定一个元组列表其中每个元组都包含一个概率和一个项目我想根据其概率对项目进行采样例如给出列表 3 a 4 b 3 c 我想在 40 的时间内对 b 进行采样在 python 中执行此操作的规范方法是什么我查看了 random 模
如何在seaborn displot中使用hist_kws

我想在同一图中用不同的颜色绘制直方图和 kde 线我想为直方图设置绿色为 kde 线设置蓝色我设法弄清楚使用 line kws 来更改 kde 线条颜色但 hist kws 不适用于显示我尝试过使用 histplot 但我无法为
为字典中的一个键附加多个值[重复]

这个问题在这里已经有答案了我是 python 新手我有每年的年份和值列表我想要做的是检查字典中是否已存在该年份如果存在则将该值附加到特定键的值列表中例如我有一个年份列表并且每年都有一个值 2010 2 2009 4 1989
如何计算 pandas 数据帧上的连续有序值

我试图从给定的数据帧中获取连续 0 值的最大计数其中包含来自 pandas 数据帧的 id date value 列如下所示 id date value 354 2019 03 01 0 354 2019 03 02 0 354 201
Scrapy：如何使用元在方法之间传递项目

我是 scrapy 和 python 的新手我试图将 parse quotes 中的项目 item author 传递给下一个解析方法 parse bio 我尝试了 request meta 和 response meta 方法如 sc
导入错误：没有名为 site 的模块 - mac

我已经有这个问题几个月了每次我想获取一个新的 python 包并使用它时我都会在终端中收到此错误 ImportError No module named site 我不知道为什么会出现这个错误实际上我无法使用任何新软件包因为每次我
如何将输入读取为数字？

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动 Why are x and y下面的代码中使用字符串而不是整数注意在Python 2
NotImplementedError：无法将符号张量 (lstm_2/strided_slice:0) 转换为 numpy 数组。时间

张量流版本 2 3 1 numpy 版本 1 20 在代码下面 define model model Sequential model add LSTM 50 activation relu input shape n steps n fe

随机推荐

Github 页面上自定义域的子域

我们可以在 Github Pages 中使用我们自己的自定义域例如我有我的页面 http example com这指向http 用户名 github io project 但现在我需要为我的存储库中的另一个文件夹创建一个子域喜欢 ht
如何跟踪 QWebKit 中的链接？

具有以下 html 的 DOM a href op order img class img button src picture gif alt border 0 a 如何跟踪 QWebKit 特别是 QWebPage 中的链接 href
spring-kafka - 如何从头开始阅读一个主题，同时从末尾阅读另一个主题？

我正在编写一个 spring kafka 应用程序其中我需要阅读 2 个主题 test1 和 test2 public class Receiver private static final Logger LOGGER LoggerFac
垂直和水平居中div，没有定义高度[重复]

这个问题在这里已经有答案了我想在页面中央显示一个 div 而不必为元素定义设置高度以便高度动态适合页面内容这可能吗我愿意使用 JS jQuery 解决方案只要它们有优雅的后备但我更喜欢纯 CSS 解决方案这是我当前的代码它将
jQuery 和 Google 地图 json 响应

我在从 google 地图 api 获取地理位置信息时遇到问题代码非常简单 ajax type GET cache false url http maps googleapis com maps api geocode json data
使用 join 时 Spark 迭代时间呈指数增长

我对 Spark 很陌生我正在尝试实现一些迭代算法以马尔可夫模型表示的质心进行聚类期望最大化所以我需要进行迭代和连接我遇到的一个问题是每次迭代时间都会呈指数增长经过一些实验我发现在进行迭代时需要保留将在下一次迭代中重用的 RD
Astyanax：简单写入抛出此异常：没有足够的字节来读取组件的值

我是 astyanax 的新手尝试了一些示例程序并收到此错误这是一个简单的写法看起来我做了一些基本错误的事情不使用复合键 Caused by InvalidRequestException why Not enough bytes
自定义警报的 UILocalNotification 重复间隔（周日、周一、周二、周三、周四、周五、周六）

我在用着UILocalNotification用于报警目的我有一个基于工作日周日周一周二周三周四周五周六重复的自定义选项很多应用程序都执行了这个过程我尽力了我的水平但我无法让它发挥作用请大家帮帮我您不能使用以下命
Google 我的商家 API 始终返回 429 代码

error code 429 message 超出配额指标的配额请求并限制服务的每分钟请求消费者的 mybusinessaccountmanagement googleapis com project number xxx erro
删除字符串中的常见字母

所以我有一个有趣的问题我正在尝试写一些混乱的单词我需要知道哪些字母我用过哪些字母我没有到目前为止我有以下代码 def remove common x y sort sort lambda x join c for c in sort
如何在自定义混合任务中从 Ecto 获取数据

我想在自定义混合任务中通过 Ecto 显示来自数据库的数据如何在我的任务中获取 Ecto 存储库或启动它我尝试过类似的方法但没有成功 defmodule Mix Tasks Users List do use Mix Task us
如何获取android中最近1个月的数据使用情况？

我需要获取上个月的数据使用统计信息有什么方法可以在android中明智地计算数据使用日期吗 I used 交通统计用于获取数据使用情况的类但它提供了自设备启动以来给定 UID 的设备的所有数据使用情况对于那些仍在寻找的人请将其放入
如何检查 Javascript 函数是否是构造函数

我注意到并非所有 Javascript 函数都是构造函数 var obj Function prototype console log typeof obj function true obj OK new obj TypeError ob
Pandas 数据框的元组列表列表？

我有一个元组列表列表其中每个元组的长度相等并且我需要将元组转换为 Pandas 数据帧使得数据帧的列等于元组的长度并且每个元组item 是跨列的行条目我咨询过有关此主题的其他问题例如将元组列表列表转换为 pandas 数据框
空基类是不是不好的设计？

我的 DTO 类需要一个基类它将在我的通用接口中使用但 DTO 类没有任何共同点它们只是包含一些属性的愚蠢类 public void GetGridData IDataForGrid
从图像中减去平均值

我正在用 Theano 实现 CNN 在论文中我必须在训练 CNN 之前进行图像预处理 We extracted RGB patches of 61x61 dimensions associated with each poselet a
TypeScript：如何同时使用粗箭头和这个？

我正在使用非常有用的局部脂肪箭头保存this回调中的上下文但是有时我需要访问该值this如果我没有使用粗箭头的话就会有一个例子是事件回调其中this具有事件发生的元素的值我知道在这个特定的示例中您可以使用event current
使用新的 1.0 SDK 使用 Firebase 的云函数生成自定义身份验证令牌

As of email protected and email protected firebase admin应用程序初始化时不再接受应用程序配置我有一个 firestore 函数可以使用 firebase admin 生成自定义令牌
如果我将 minAPI 设置为 21，我是否需要 AppCompat？

我决定将 Android 的最低 API 版本设为 21 但这是否意味着不再使用 AppCompat 没有意义了只使用简单的材料设计没有AppCompat 等等不您应该始终使用 AppCompat 这可确保您的应用程序在所有 API
在 Pandas DataFrame 中界定值高于特定阈值的连续区域

我有一个 Pandas Dataframe 其索引和值在 0 到 1 之间如下所示 6 0 047033 7 0 047650 8 0 054067 9 0 064767 10 0 073183 11 0 077950 我想检索元组超过

在 Pandas DataFrame 中界定值高于特定阈值的连续区域

在 Pandas DataFrame 中界定值高于特定阈值的连续区域 的相关文章

随机推荐

热门标签

在 Pandas DataFrame 中界定值高于特定阈值的连续区域的相关文章