从 pandas DataFrame 中删除少于 K 个连续 NaN

2024-05-21

我正在处理时间序列数据。我在从数据帧列中删除小于或等于阈值的连续 NaN 时遇到问题。我尝试查看一些链接，例如：

：标识连续 NaN 出现的位置以及计数。

Pandas：NaN 孔的游程长度 https://stackoverflow.com/questions/16857407/pandas-run-length-of-nan-holes：输出 NaN 的游程长度编码

这条路上还有很多其他人，但没有一个人真正告诉我们在识别后如何删除它们。

我找到了一个类似的解决方案，但那是在 R 中：如何删除列中超过 2 个连续的 NA？ https://stackoverflow.com/questions/42668059/how-to-remove-more-than-2-consecutive-nas-in-a-column

我想要Python的解决方案。

所以这是一个例子：

这是我的数据框列：

如果 k = 3，我的输出应该是：

我该如何删除小于或等于某个阈值 (k) 的连续 NaN。

有几种方法，但我是这样做的：

使用整齐的方法确定连续数字组cumsum trick
Use groupby + transform确定每个组的大小
识别阈值内的 NaN 组
使用布尔索引过滤掉它们。

k = 3 
i = df.a.isnull()
m = ~(df.groupby(i.ne(i.shift()).cumsum().values).a.transform('size').le(k) & i)

df[m]

a
0   36.45
1   35.45
5   37.21
6   35.63
7   36.45
8   34.65
9   31.45
12  36.71
13  35.55
14    NaN
15    NaN
16    NaN
17    NaN
18  37.71

你可以执行df = df[m]; df.reset_index(drop=True)如果您想要单调递增的整数索引，请在最后执行步骤。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

NaN

从 pandas DataFrame 中删除少于 K 个连续 NaN 的相关文章

Flask 和 uWSGI - 无法加载应用程序 0 (mountpoint='')（找不到可调用或导入错误）

当我尝试使用 uWSGI 启动 Flask 时出现以下错误我是这样开始的 gt cd gt root localhost uwsgi socket 127 0 0 1 6000 file path to folder run py ca
如何在 Sublime Text 2 的 OSX 终端中显示构建结果

我刚刚从 TextMate 切换到 Sublime Text 2 我非常喜欢它让我困扰的一件事是默认的构建结果显示在 ST2 的底部我的程序产生一些很长的结果显示它的理想方式如在 TM2 中是并排查看它们如何在 Mac 操作系统
如何在Windows上模拟socket.socketpair

标准Python函数套接字套接字对 https docs python org 3 library socket html socket socketpair不幸的是它在 Windows 上不可用从 Python 3 4 1 开始我
如何等到 Excel 计算公式后再继续 win32com

我有一个 win32com Python 脚本它将多个 Excel 文件合并到电子表格中并将其另存为 PDF 现在的工作原理是输出几乎都是 NAME 因为文件是在计算 Excel 文件内容之前输出的这可能需要一分钟如何强制工作簿计算值
打破嵌套循环[重复]

这个问题在这里已经有答案了有没有比抛出异常更简单的方法来打破嵌套循环在Perl https en wikipedia org wiki Perl 您可以为每个循环指定标签并且至少继续一个外循环 for x in range 10 fo
在pyyaml中表示具有相同基类的不同类的实例

我有一些单元测试集希望将每个测试运行的结果存储为 YAML 文件以供进一步分析 YAML 格式的转储数据在几个方面满足我的需求但测试属于不同的套装结果有不同的父类这是我所拥有的示例 gt gt gt rz shorthand for
python 集合可以包含的值的数量是否有限制？

我正在尝试使用 python 设置作为 mysql 表中 ids 的过滤器 python集存储了所有要过滤的id 现在大约有30000个这个数字会随着时间的推移慢慢增长我担心python集的最大容量它可以包含的元素数量有限制吗您最大
表达式中的 Python 'in' 关键字与 for 循环中的比较 [重复]

这个问题在这里已经有答案了我明白什么是in运算符在此代码中执行的操作 some list 1 2 3 4 5 print 2 in some list 我也明白i将采用此代码中列表的每个值 for i in 1 2 3 4 5 print
如何改变Python中特定打印字母的颜色？

我正在尝试做一个简短的测验并且想将错误答案显示为红色欢迎来到我的测验您想开始吗是的祝你好运法国的首都是哪里法国随机答案不正确的答案我正在尝试将其显示为红色我的代码是 print Welcome to my Quiz be
如何在 Django 中使用并发进程记录到单个文件而不使用独占锁

给定一个在多个服务器上同时执行的 Django 应用程序该应用程序如何记录到单个共享日志文件在网络共享中而不保持该文件以独占模式永久打开当您想要利用日志流时这种情况适用于 Windows Azure 网站上托管的 Django 应
Python：计算字典的重复值

我有一本字典如下 dictA unit1 test1 alpha unit1 test2 beta unit2 test1 alpha unit2 test2 gamma unit3 test1 delta unit3 test2 gamm
检查所有值是否作为字典中的键存在

我有一个值列表和一本字典我想确保列表中的每个值都作为字典中的键存在目前我正在使用两组来确定字典中是否存在任何值 unmapped set foo set bar keys 有没有更Pythonic的方法来测试这个感觉有点像黑客您的方
VSCode：调试配置中的 Python 路径无效

对 Python 和 VSCode 以及 stackoverflow 非常陌生直到最近我已经使用了大约 3 个月一切都很好当尝试在调试器中运行任何基本的 Python 程序时弹出窗口The Python path in your
如何从没有结尾的管道中读取 python 中的 stdin

当管道来自打开时不知道正确的名称我无法从 python 中的标准输入或管道读取数据文件我有作为例子管道测试 py import sys import time k 0 try for line in sys stdin k k
对输入求 Keras 模型的导数返回全零

所以我有一个 Keras 模型我想将模型的梯度应用于其输入这就是我所做的 import tensorflow as tf from keras models import Sequential from keras layers imp
从 Python 中的类元信息对 __init__ 函数进行类型提示

我想做的是复制什么SQLAlchemy确实以其DeclarativeMeta班级有了这段代码 from sqlalchemy import Column Integer String from sqlalchemy ext declar
如何使用google colab在jupyter笔记本中显示GIF？

我正在使用 google colab 想嵌入一个 gif 有谁知道如何做到这一点我正在使用下面的代码它并没有在笔记本中为 gif 制作动画我希望笔记本是交互式的这样人们就可以看到代码的动画效果而无需运行它我发现很多方法在 Goo
使用基于正则表达式的部分匹配来选择 Pandas 数据帧的子数据帧

我有一个 Pandas 数据框它有两列一列进程参数列包含字符串另一列值列包含相应的浮点值我需要过滤出部分匹配列过程参数中的一组键的子数据帧并提取与这些键匹配的数据帧的两列 df pd DataFrame Proce
Python - 字典和列表相交

给定以下数据结构找出这两种数据结构共有的交集键的最有效方法是什么 dict1 2A 3A 4B list1 2A 4B Expected output 2A 4B 如果这也能产生更快的输出我可以将列表不是 dict1 组织到任何其他数
Python：元类属性有时会覆盖类属性？

下面代码的结果让我感到困惑 class MyClass type property def a self return 1 class MyObject object metaclass MyClass a 2 print MyObject

随机推荐

Restangular - _.contains() 不是一个函数

如果您最近通过 Bower 更新了 Restangular 它将安装最新的 Lodash 新的 4 0 然而这是一个问题因为 Restangular Angular 现在会抛出错误 contains 不是函数你怎么解决解决方案非常简
当找到匹配时使用 sed 替换行首

我有一个 Java 文件我想注释包含匹配的任何代码行 myvar 我认为 sed 应该在这里帮助我 sed s myVar not sure what to put here g MyFile java 我不知道要输入什么 not sur
如何在c linux中收听特定接口上的广播？

我目前可以通过执行以下操作来收听我编写的简单广播服务器仅广播 hello int fd socket PF INET SOCK DGRAM 0 struct sockaddr in addr memset addr 0 sizeof ad
使用 C# 动态创建按钮并按预定义的顺序放置它们

NET 4 5 C 创建 Windows 窗体我想动态创建和添加按钮并为其分配单击事件但希望它们以特定的方式动态放置就像图像一样我的问题是如何以上述方式动态放置按钮即 4x4 格式一行 4 个按钮 4 列但行数不受限制是否可
如何增加 dot net core 2.1 项目中 WCF 服务的超时值

我发布此内容是因为我无法在 Stack Overflow 上找到任何位置通过连接服务添加服务引用来解决利用 WCF 的 Net Core 项目的此问题我的问题是由于长时间运行的操作请求我面临客户端超时那么由于 Net Core 不
在网站上显示存储在 Google 云端硬盘中的文件（例如图像）

我想知道是否可以在公共网站上访问显示存储在 Google Drive 中的图像等文件解决方法是获取fileId with Google Drive SDK API然后使用这个Url 文件ID 这将是您在 Google 云端硬盘中的文件
while循环只执行一次

我很难弄清楚为什么 while 循环实际上不会循环它运行一次并停止 import java util public class mileskm public static void main String args Scanner inp
双击打开 ipython 笔记本

相关文章通过双击 osx 打开 ipython 笔记本 https stackoverflow com questions 16158893 open an ipython notebook via double click on osx
如何在 SVG 元素上使用箭头标记？

我需要在 d3 js 中创建一个箭头但我找到的只是带有节点图的示例我需要的是简单地制作一个从 A 点到 B 点的箭头我尝试实现以下示例中的部分代码 http bl ocks org 1153292 http bl ocks org 1
告诉 GORM 不要保留属性

有没有办法告诉 GORM 不要保留某个属性我计划在我的 User 类上定义一个确认密码属性我将使用它进行验证但不应保留使用瞬态关键字 GORM 可以指示不保留特定属性以下代码片段显示了瞬态属性的使用 class Book stat
Excel 公式从单元格中获取字符串值并按字母顺序对其字符进行排序

你能帮我制作一个 Excel 公式从单元格中获取字符串值并按字母顺序对其字符进行排序吗 Ex 原始单元格值 BACR 已排序的字符单元格 ABCR 编辑 2022 年 4 月 29 日随着 Office 365 Excel 中引入的动态
如何提高环复杂度？

对于具有大量决策语句包括 if while for 语句的方法循环复杂度会很高那么我们该如何改进呢我正在处理一个大项目我应该减少 CC gt 10 的方法的 CC 并且有很多方法都存在这个问题下面我将列出一些例如我遇到的问题的
SQL Server“未找到网络路径”在不同环境中随机且不频繁地发生

类似如果不是同一个问题随机遇到网络路径未找到异常 https stackoverflow com questions 38696448 network path not found exception encountered rando
膨胀类 android.support.design.widget.CoordinatorLayoute 时出错

我正在尝试运行我的应用程序但不断收到标题中列出的错误我读过周围的内容人们说尝试将主题更改为 AppCombat 主题但这似乎不起作用以下是我遇到的错误 Process com example jmeyer27 crazytiles
我可以使用 jQuery 动态创建文件（及其内容）吗？ [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 这是我的 HTML 代码 ul li
在android中使用BaseActivity的不同活动中的通用标头

我想编写一次代码并在不同的活动中使用我创建了一个Base Activity class为了那个原因此外不同活动中所有布局的标题都是相同的我在以下人员的帮助下做到了这一点
python 线程安全可变对象复制

Is 蟒蛇的copy http docs python org 2 library copy html模块线程安全吗如果不是我应该如何在 python 中以线程安全的方式复制 deepcopy 可变对象蟒蛇的GIL http en w
TKinter 中的禁用/启用按钮

我正在尝试制作一个像开关一样的按钮所以如果我单击禁用按钮它将禁用按钮有效如果我再次按下它它将再次启用它我尝试了 if else 之类的东西但没有成功这是一个例子 from tkinter import fenster Tk
Maven 构建在 Jenkins 上失败，但可以在本地计算机上运行

我有一个全新安装的 Debian Wheezy 服务器运行 Jenkins 1 596 最新版本安装自官方deb包 http pkg jenkins ci org debian 为了与詹金斯一起玩我创建了一个新的Maven项目使用 G
从 pandas DataFrame 中删除少于 K 个连续 NaN

我正在处理时间序列数据我在从数据帧列中删除小于或等于阈值的连续 NaN 时遇到问题我尝试查看一些链接例如标识连续 NaN 出现的位置以及计数 Pandas NaN 孔的游程长度 https stackoverflow com que

从 pandas DataFrame 中删除少于 K 个连续 NaN

从 pandas DataFrame 中删除少于 K 个连续 NaN 的相关文章

随机推荐

热门标签