对 pandas 中的布尔值进行重新采样

2024-01-05

我遇到了一个属性，我发现在其中重新采样布尔值很奇怪pandas。这是一些时间序列数据：

import pandas as pd
import numpy as np

dr = pd.date_range('01-01-2020 5:00', periods=10, freq='H')
df = pd.DataFrame({'Bools':[True,True,False,False,False,True,True,np.nan,np.nan,False],
                   "Nums":range(10)},
                  index=dr)

所以数据看起来像：

                     Bools  Nums
2020-01-01 05:00:00   True     0
2020-01-01 06:00:00   True     1
2020-01-01 07:00:00  False     2
2020-01-01 08:00:00  False     3
2020-01-01 09:00:00  False     4
2020-01-01 10:00:00   True     5
2020-01-01 11:00:00   True     6
2020-01-01 12:00:00    NaN     7
2020-01-01 13:00:00    NaN     8
2020-01-01 14:00:00  False     9

我本以为在重新采样时可以对布尔列执行简单的操作（如求和），但是（按原样）这会失败：

>>> df.resample('5H').sum()

                    Nums
2020-01-01 05:00:00    10
2020-01-01 10:00:00    35

“Bools”列被删除。我对为什么会发生这种情况的印象是 b/cdtype该列的object。更改可以解决该问题：

>>> r = df.resample('5H')
>>> copy = df.copy() #just doing this to preserve df for the example
>>> copy['Bools'] = copy['Bools'].astype(float)
>>> copy.resample('5H').sum()

                     Bools  Nums
2020-01-01 05:00:00    2.0    10
2020-01-01 10:00:00    2.0    35

但是（奇怪的是）你can仍然通过索引重采样对象来对布尔值求和，而不改变dtype:

>>> r = df.resample('5H')
>>> r['Bools'].sum()

2020-01-01 05:00:00    2
2020-01-01 10:00:00    2
Freq: 5H, Name: Bools, dtype: int64

而且，如果唯一的列是布尔值，您仍然可以重新采样（尽管该列仍然是object):

>>> df.drop(['Nums'],axis=1).resample('5H').sum()

                    Bools
2020-01-01 05:00:00      2
2020-01-01 10:00:00      2

是什么让后两个例子能够发挥作用？我可以看到也许他们更明确一点（“拜托，我真的很想重新尝试这个专栏！”），但我不明白为什么原来resample如果可以完成则不允许该操作。

嗯，追踪表明：

df.resample('5H')['Bools'].sum == Groupby.sum (in pd.core.groupby.generic.SeriesGroupBy)

df.resample('5H').sum == sum (in pandas.core.resample.DatetimeIndexResampler)

和跟踪groupby_function in 分组依据.py https://github.com/pandas-dev/pandas/blob/v1.0.5/pandas/core/groupby/groupby.py表明它相当于r.agg(lambda x: np.sum(x, axis=r.axis)) where r = df.resample('5H')其输出：

                     Bools  Nums  Nums2
2020-01-01 05:00:00      2    10     10
2020-01-01 10:00:00      2    35     35

好吧，实际上，应该是r = df.resample('5H')['Bool']（仅适用于上述情况）

并追踪_downsample函数于重新采样.py https://github.com/pandas-dev/pandas/blob/v1.0.5/pandas/core/resample.py表明它相当于：df.groupby(r.grouper, axis=r.axis).agg(np.sum)其输出：

                     Nums  Nums2
2020-01-01 05:00:00    10     10
2020-01-01 10:00:00    35     35

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

Boolean

pandasresample

对 pandas 中的布尔值进行重新采样的相关文章

Python 类型提示 Dict 语法错误可变默认值是不允许的。使用“默认工厂”

我不知道为什么解释器会抱怨这个类型的字典对于这两个实例我得到一个不允许可变默认值使用默认工厂语法错误我使用的是 python 3 7 3 from dataclasses import dataclass from typing
为什么 dataclasses.astuple 返回类属性的深层副本？

在下面的代码中astuple函数正在执行数据类的类属性的深层复制为什么它不能产生与函数相同的结果my tuple import copy import dataclasses dataclasses dataclass class Dem
在 Celery 任务中调用 Google Cloud API 永远不会返回

我正在尝试拨打外部电话Google Cloud Natural Language API从一个内Celery任务使用google cloud python包裹问题是对 API 的调用永远不会返回挂起 celery task def g
NLTK 2.0分类器批量分类器方法

当我运行此代码时它会抛出一个错误我认为这是由于 NLTK 3 0 中不存在batch classify 方法我很好奇如何解决旧版本中的某些内容在新版本中消失的此类问题 def accuracy classifier gold resu
GUI（输入和输出矩阵）？

我需要创建一个 GUI 将数据输入到矩阵或表格中并读取此表单数据完美的解决方案是限制输入表单仅允许float 例如 A 1 02 0 25 0 30 0 515 0 41 1 13 0 15 1 555 0 25 0 14 1 21 2
Python 内置的 super() 是否违反了 DRY？

显然这是有原因的但我没有足够的经验来认识到这一点这是Python中给出的例子docs http docs python org 2 library functions html super class C B def method se
如何将特定范围内的标量添加到 numpy 数组？

有没有一种更简单更节省内存的方法可以单独在 numpy 中执行以下操作 import numpy as np ar np array a l r ar c a a 0 l ar tolist a r 它可能看起来很原始但它涉及获取给定数
从 Powershell 脚本安装 Python

当以管理员身份从 PowerShell 命令行运行以下命令时可以在 Windows 11 上成功安装 Python c temp python 3 11 4 amd64 exe quiet InstallAllUsers 0 Instal
Java 和 Python 可以在同一个应用程序中共存吗？

我需要一个 Java 实例直接从 Python 实例数据存储中获取数据我不知道这是否可能数据存储是否透明唯一或者每个实例如果它们确实可以共存都有其单独的数据存储总结一下 Java 应用程序如何从 Python 应用程序的数据存
无法导入 langchain.agents.load_tools

我正在尝试使用 LangChain Agents 但无法导入 load tools 版本 langchain 0 0 27 我尝试过这些 from langchain agents import initialize agent from
当字段是数字时怎么说...在 mongodb 中匹配？

所以我的结果中有一个名为城市的字段结果已损坏有时它是一个实际名称有时它是一个数字以下代码显示所有记录 db zips aggregate project city substr city 0 1 sort city 1 我需要修
如何将 ascii 值列表转换为 python 中的字符串？

我在 Python 程序中有一个列表其中包含一系列数字这些数字本身就是 ASCII 值如何将其转换为可以在屏幕上回显的常规字符串您可能正在寻找 chr gt gt gt L 104 101 108 108 111 44 32 1
pandas - 包含时间序列数据的堆积条形图

我正在尝试使用时间序列数据在 pandas 中创建堆积条形图 DATE TYPE VOL 0 2010 01 01 Heavy 932 612903 1 2010 01 01 Light 370 612903 2 2010 01 01 Me
Python GTK+ 画布

我目前正在通过 PyGobject 学习 GTK 需要画布之类的东西我已经搜索了文档发现两个小部件似乎可以完成这项工作 GtkDrawingArea 和 GtkLayout 我需要一些基本函数如 fillrect 或 drawline
如何使用 Python 3 检查目录是否包含文件

我到处寻找这个答案但找不到我正在尝试编写一个脚本来搜索特定的子文件夹然后检查它是否包含任何文件如果包含则写出该文件夹的路径我已经弄清楚了子文件夹搜索部分但检查文件却难倒了我我发现了有关如何检查文件夹是否为空的多个建议并且我尝
在 Google App Engine 中，如何避免创建具有相同属性的重复实体？

我正在尝试添加一个事务以避免创建具有相同属性的两个实体在我的应用程序中每次看到新的 Google 用户登录时我都会创建一个新的播放器当新的 Google 用户在几毫秒内进行多个 json 调用时我当前的实现偶尔会创建重复的播放器
python 中的“槽包装器”是什么？

object dict 和其他地方的隐藏方法设置为这样的
如果 PyPy 快 6.3 倍，为什么我不应该使用 PyPy 而不是 CPython？

我已经听到很多关于PyPy http en wikipedia org wiki PyPy项目他们声称它比现有技术快 6 3 倍CPython http en wikipedia org wiki CPython口译员开启他们的网站 ht
每当使用 import cv2 时 OpenCV 都会出错

我在终端上使用 pip3 install opencv contrib python 安装了 cv2 并且它工作了但是每当我尝试导入 cv2 或运行导入了 cv2 的 vscode 文件时在 python IDLE 上它都会说 Trac
pytest找不到模块[重复]

这个问题在这里已经有答案了我正在关注pytest 良好实践 https docs pytest org en latest explanation goodpractices html test discovery或者至少我认为我是但是

随机推荐

cython 编译 - 导入与 cimport

Cython 新手也许这是一个基本问题考虑两个例子两者都取自这个博客在这里 http technicaldiscovery blogspot com 2011 06 speeding up python numpy cython an
paramiko 中的管道命令

如何在 paramiko 中运行管道命令我正在这样做 statement grep thing file grep thing2 tail 1 last msg conn execute statement 我得到的输出grep thin
将 jquery 选择器存储在变量中

在下面的示例中stored jQuery selector返回错误的值是否可以存储选择器而不是结果 js代码 storing the jQuery selectors var container container element1 co
验证对象是否存在于 django 视图中而不返回 404 的正确方法是什么？

我需要验证对象是否存在并返回该对象然后基于该对象执行操作在不返回 404 的情况下执行此操作的正确方法是什么 try listing RealEstateListing objects get slug url slug except
在 SvelteKit 中全局导入图像 url

我正在尝试以通配符方式导入目录中图像的所有 url 并有两个可能的扩展名 import urls from static images png svg 目前该目录中有三个文件单独导入它们可以正常工作当我使用此语法时找不到文件无法解析
以编程方式访问所有新的 Chrome 通知

我以前没有编程 Google Chrome 插件的经验这就是为什么我从这里开始看看我想要完成的事情是否可能合理不过我在编程方面确实拥有相当广泛的经验我想要的是当新的 Chrome 通知你知道系统托盘上方的这些小弹出窗口弹出时
foursquare API 的 IP 地址范围是多少？ [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案我正在大学的防火墙后面使用虚拟机开发 Web 服务我需要知道要向我们的 IT 人员提供的 IP 地址范围以便我们能够访问 foursquare 的
Microsoft Graph Api OAuth 返回状态代码 200 而不是 302（不重定向到登录页面）

获取 Microsoft Graph API 的令牌这是第一个调用让身份验证用户 microsoft 并获取调用令牌服务的代码请求已正确发送但不是获取状态代码 302 以便可以将其重定向到登录页面我收到状态代码 200 publi
SQL Profiler 可以与 LocalDB 一起使用吗？

是否可以使用 SQL Profiler 来观察 LocalDB 实例请求的查询只要您知道正确的服务器名称就可以像使用所有其他 SQL 版本一样使用 SQL Profiler 您可以使用以下命令找到服务器名称本地数据库 http tech
参数中缺少必需的键“Bucket”

我正在尝试将一个简单的 lambda 函数部署到 aws 但收到错误参数中缺少必需的键 Bucket 我创建的用户拥有完整的 Lambda S3 Cloudformation 和 Cloudwatch 访问权限 JS 使用严格 module
ExtJS 别名与 id

我不明白的用法alias http docs sencha com extjs 4 2 1 api Ext Class cfg aliasExtJS 中的 id 与 itemId 配置属性对比应用程序视图 foo js Ext defi
获取隐藏字段值的代码隐藏

如何获取隐藏字段的值
使用 Swift 创建 Flutter 项目

Flutter 允许支持Swift编程语言我怎样才能整合我的SwiftAndroid Studio 中 Flutter 项目的代码文件没有添加创建 Swift 文件的选项在NewAndroid Studio 中的菜单我认为更好的方
比较 Java 中的 2 个字符串是否有分隔符

字符串 1 func1 test1 字符串2 func1 test2 我想将这两个字符串与第一个左大括号进行比较因此对于给定的示例它应该返回 true 因为两个字符串中直到的字符串都是 func1 有没有什么方法可以在不分裂的情况
如何在asp.net core中处理cookie过期

我想知道如何正确处理cookie过期的情况是否可以执行自定义操作我想要实现的是当 cookie 过期时从当前 cookie 中取出一些信息并通过该信息重定向到操作参数是否可以没有一个好的方法可以实现这一点如果 cookie
在 C++ 中处理 CPU 异常

是否有跨平台的方法来处理 CPU 异常例如分段错误或除以零可以说我需要调用一些潜在不安全的函数例如从插件文件这可能会导致段错误或在执行之前无法测试的一些其他问题我知道 C 标准库有信号处理函数但我不知道如何使用它们来处理问题
为什么我收到“无法解析符号”？

我以前导入过这个项目没有任何困难我不确定发生了什么变化 I click Import Project并选择了getting started with selenium http github com ddavison getting s
使用 thymeleaf 中的搜索功能和请求参数

我有一个页面可以在其中获取条目列表现在我希望能够从这些列表中进行搜索我当前用于检索列表的网址是 show products 我想在此页面中添加一个搜索表单以便我可以使用请求参数进行搜索是的我可以使用ajax 但我必须使用请求参
从 pdf 中读取证书

我正在使用 ITextSharp 来从数字签名的 pdf 文档中读取证书信息 The ITextSharp Text Pdf PdfPKCS7类公开三个属性 Certificates 如清单所示 SignCertificate 作为单个对象
对 pandas 中的布尔值进行重新采样

我遇到了一个属性我发现在其中重新采样布尔值很奇怪pandas 这是一些时间序列数据 import pandas as pd import numpy as np dr pd date range 01 01 2020 5 00 perio

对 pandas 中的布尔值进行重新采样

对 pandas 中的布尔值进行重新采样 的相关文章

随机推荐

热门标签

对 pandas 中的布尔值进行重新采样的相关文章