用 Pandas 数据框中尽可能少的日期填充缺失的日期值

2023-12-03

我有一个带有日期列的数据框,

df = pd.DataFrame({'date':['2014-10-01', np.nan, '2015-09-30', np.nan, np.nan, '2019-06-03']})

现在我想用 pandas 中尽可能少的日期值来估算缺失的日期值。估算当前日期很容易datetime.now()但对于一种特殊情况我想要NaN用日期中可能的最小值来估算的值。

Now datetime允许最短日期为'0001-01-01'但这对于熊猫来说是不可接受的。在输入这个值时,我得到的错误是

OutOfBoundsDatetime: Out of bounds nanosecond timestamp: 1-01-01 00:00:00

我尝试在 stackoverflow 上查找,但找不到 pandas 中可接受的最小日期的可能答案。

有人知道这一点吗?

编辑:我并不真正关心“OutOfBoundsDatetime”,我很好奇知道熊猫可以接受的最小可能日期。


如果你想要一个与熊猫相处融洽的约会,你需要考虑pd.Timestamp,因为这是datetimepandas 使用的类型。

如果您不介意日期有时间部分,请使用pd.Timestamp.min:

pd.Timestamp.min
# Timestamp('1677-09-21 00:12:43.145225')

pd.to_datetime(df['date'].fillna(pd.Timestamp.min))

0   2014-10-01 00:00:00.000000
1   1677-09-21 00:12:43.145225
2   2015-09-30 00:00:00.000000
3   1677-09-21 00:12:43.145225
4   1677-09-21 00:12:43.145225
5   2019-06-03 00:00:00.000000
Name: date, dtype: datetime64[ns]

如果您只想要日期(没有时间),那么没有时间部分的最小日期将是

pd.Timestamp.min.ceil('D')
# Timestamp('1677-09-22 00:00:00')

pd.to_datetime(df['date'].fillna(pd.Timestamp.min.ceil('D')))

0   2014-10-01
1   1677-09-22
2   2015-09-30
3   1677-09-22
4   1677-09-22
5   2019-06-03
Name: date, dtype: datetime64[ns]
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

用 Pandas 数据框中尽可能少的日期填充缺失的日期值 的相关文章

  • Python 的键盘中断不会中止 Rust 函数 (PyO3)

    我有一个使用 PyO3 用 Rust 编写的 Python 库 它涉及一些昂贵的计算 单个函数调用最多需要 10 分钟 从 Python 调用时如何中止执行 Ctrl C 好像只有执行结束后才会处理 所以本质上没什么用 最小可重现示例 Ca
  • SQLAlchemy 通过关联对象声明式多对多自连接

    我有一个用户表和一个朋友表 它将用户映射到其他用户 因为每个用户可以有很多朋友 这个关系显然是对称的 如果用户A是用户B的朋友 那么用户B也是用户A的朋友 我只存储这个关系一次 除了两个用户 ID 之外 Friends 表还有其他字段 因此
  • 将 saxon 与 python 结合使用

    我需要使用 python 处理 XSLT 目前我正在使用仅支持 XSLT 1 的 lxml 现在我需要处理 XSLT 2 有没有办法将 saxon XSLT 处理器与 python 一起使用 有两种可能的方法 设置一个 HTTP 服务 接受
  • 如何在flask中使用g.user全局

    据我了解 Flask 中的 g 变量 它应该为我提供一个全局位置来存储数据 例如登录后保存当前用户 它是否正确 我希望我的导航在登录后在整个网站上显示我的用户名 我的观点包含 from Flask import g among other
  • 为 Anaconda Python 安装 psycopg2

    我有 Anaconda Python 3 4 但是每当我运行旧代码时 我都会通过输入 source activate python2 切换到 Anaconda Python 2 7 我的问题是我为 Anaconda Python 3 4 安
  • 使用带有关键字参数的 map() 函数

    这是我尝试使用的循环map功能于 volume ids 1 2 3 4 5 ip 172 12 13 122 for volume id in volume ids my function volume id ip ip 我有办法做到这一点
  • 如何使用 Ansible playbook 中的 service_facts 模块检查服务是否存在且未安装在服务器中?

    我用过service facts检查服务是否正在运行并启用 在某些服务器中 未安装特定的软件包 现在 我如何知道这个特定的软件包没有安装在该特定的服务器上service facts module 在 Ansible 剧本中 它显示以下错误
  • 使用 on_bad_lines 将 pandas.read_csv 中的无效行写入文件

    我有一个 CSV 文件 我正在使用 Python 来解析该文件 我发现文件中的某些行具有不同的列数 001 Snow Jon 19801201 002 Crom Jake 19920103 003 Wise Frank 19880303 l
  • python 相当于 R 中的 get() (= 使用字符串检索符号的值)

    在 R 中 get s 函数检索名称存储在字符变量 向量 中的符号的值s e g X lt 10 r lt XVI s lt substr r 1 1 X get s 10 取罗马数字的第一个符号r并将其转换为其等效整数 尽管花了一些时间翻
  • 使用 Tkinter 显示 numpy 数组中的图像

    我对 Python 缺乏经验 第一次使用 Tkinter 制作一个 UI 显示我的数字分类程序与 mnist 数据集的结果 当图像来自 numpy 数组而不是我的 PC 上的文件路径时 我有一个关于在 Tkinter 中显示图像的问题 我为
  • 从 Flask 访问 Heroku 变量

    我已经使用以下命令在 Heroku 配置中设置了数据库变量 heroku config add server xxx xxx xxx xxx heroku config add user userName heroku config add
  • 如何在ipywidget按钮中显示全文?

    我正在创建一个ipywidget带有一些文本的按钮 但按钮中未显示全文 我使用的代码如下 import ipywidgets as widgets from IPython display import display button wid
  • 在Python中获取文件描述符的位置

    比如说 我有一个原始数字文件描述符 我需要根据它获取文件中的当前位置 import os psutil some code that works with file lp lib open path to file p psutil Pro
  • Jupyter Notebook 内核一直很忙

    我已经安装了 anaconda 并且 python 在 Spyder IPython 等中工作正常 但是我无法运行 python 笔记本 内核被创建 它也连接 但它始终显示黑圈忙碌符号 防火墙或防病毒软件没有问题 我尝试过禁用两者 我也无法
  • 如何在Python中对类别进行加权随机抽样

    给定一个元组列表 其中每个元组都包含一个概率和一个项目 我想根据其概率对项目进行采样 例如 给出列表 3 a 4 b 3 c 我想在 40 的时间内对 b 进行采样 在 python 中执行此操作的规范方法是什么 我查看了 random 模
  • 如何在 Python 中追加到 JSON 文件?

    我有一个 JSON 文件 其中包含 67790 1 kwh 319 4 现在我创建一个字典a dict我需要将其附加到 JSON 文件中 我尝试了这段代码 with open DATA FILENAME a as f json obj js
  • Conda SafetyError:文件大小不正确

    使用创建 Conda 环境时conda create n env name python 3 6 我收到以下警告 Preparing transaction done Verifying transaction SafetyError Th
  • 发送用户注册密码,django-allauth

    我在 django 应用程序上使用 django alluth 进行身份验证 注册 我需要创建一个自定义注册表单 其中只有一个字段 电子邮件 密码将在服务器上生成 这是我创建的表格 from django import forms from
  • Rocket UniData/UniVerse:ODBC 无法分配足够的内存

    每当我尝试使用pyodbc连接到 Rocket UniData UniVerse 数据时我不断遇到错误 pyodbc Error 00000 00000 Rocket U2 U2ODBC 0302810 Unable to allocate
  • Statsmodels.formula.api OLS不显示截距的统计值

    我正在运行以下源代码 import statsmodels formula api as sm Add one column of ones for the intercept term X np append arr np ones 50

随机推荐

  • 响应通知后按下后退按钮返回上一屏幕

    我正在使用类似的代码创建一个简单的通知创建并显示来自网络调用的通知 问题是 我希望响应通知的活动完成其业务 然后单击后退按钮 将先前活动的活动放回前台 并保持其后堆栈完好无损 这与之前的活动活动是我的应用程序还是其他人的应用程序的一部分无关
  • 从java以编程方式执行spark-submit

    我试图通过以下方式执行它 Process process Runtime getRuntime exec spark cmd 没有运气 通过 shell 运行的命令启动了我的应用程序 该应用程序成功了 通过 exec 运行它会启动一个进程
  • 如何在 Skyfield 中添加 JulianDate 对象或偏移

    The JulianDate对象在Skyfield是一种快速生成并保存一组儒略日时间值并将其传递给 Skyfield 的简便方法at 计算各种坐标中天文位置的方法 参见示例脚本 但是 我似乎找不到add or offset方法 以便我可以将
  • 如何删除/更新bigquery中的嵌套数据

    有没有办法删除 更新bigquery中的嵌套字段 假设我有这个数据 wives age wives name name 21 angel adam 20 kale 21 victoria rossi 20 jessica 或者在 json
  • 如何删除所有包含某个子字符串的PHP数组元素? [复制]

    这个问题在这里已经有答案了 好吧 我查了一些函数 但我似乎没有幸运地找到任何函数 我想过滤一个数组以删除包含某些字符串的特定数组 这是一个例子 array 1 gt January 2 gt February 3 gt March to r
  • jQuery document.createElement 等效吗?

    我正在重构一些旧的 JavaScript 代码 并且正在进行大量 DOM 操作 var d document var odv d createElement div odv style display none this OuterDiv
  • 从以 http 运行的网站使用 https 访问 CDN

    我正在开发一个网站 该网站将采用http 我试图包含来自 google cdn 的 jquery 给出的答案here says 使用协议相关的 URL 可让您轻松避免混合内容 安全错误 from 谷歌CDN 它被视为 我们建议您通过 HTT
  • 什么是指向数组数据开头的 Python 缓冲区对象?

    A np arange 12 B A reshape 3 4 A 0 42 print B print A print np may share memory A B print A data B data 运行上面的代码 令我惊讶的是pr
  • Cordova 网络 isOnline 仅在 WiFi 上返回 true

    以下仅当我有 WiFi 时才注销 在 4g 或任何移动互联网类型上则不然 看起来不太靠谱 有什么更好的检测在线 离线状态的想法吗 rootScope on cordovaNetwork online function event netwo
  • 尝试将 XInclude 与 Java 结合使用并使用 xml:id 解析片段

    我一直在尝试让 XInclude 在我的 XML 文档中工作 最后让它在 Oxygen XML 中工作 我用 Oxygen XML 来编写 XML 文档 然后我转到我的应用程序 用 Java 编写 但它似乎不支持任何形式的 XPointer
  • 将 pandas 中的列表拆分为列

    我有一个像这样的数据框 df pd DataFrame ID ID1 ID2 ID3 Values AB BC np NaN AB CD df ID Values 0 ID1 AB BC 1 ID2 NaN 2 ID3 AB CD 我想将列
  • MssqlHook气流连接

    我是使用气流的新手 我需要做的是使用 MssqlHook 但我不知道如何使用 我应该在构造函数中给出哪些元素 我在气流中有一个名为connection test的连接 我不完全理解类中的属性 class MsSqlHook DbApiHoo
  • 计算多个数据集的日、月和年平均值

    我有一个数据框 MS NR SS NR DATE HOUR VALUE 1 13095010 68 1 01 2014 0 00 00 9 8 2 13095010 68 1 01 2014 1 00 00 8 0 3 13095010 6
  • css3背景大小:覆盖在调整大小时留下空白

    body margin 0 padding 0 position relative background url images imgs backgrnd png no repeat background size cover The ba
  • 用逗号分割字符串但忽略双引号内的逗号?

    我有一些如下所示的输入 A B C D12121 E F G H I9 I8 J K 逗号分隔的值可以按任何顺序 我想用逗号分隔字符串 但是 如果双引号内有某些内容 我需要它忽略逗号并删除引号 所以基本上 输出将是这个字符串列表 A B C
  • tkinter:将多个按钮 lambda 映射到一个标签?

    描述 我希望能够单击一个按钮并将其值发送到标签小部件 lab 1 我知道要执行一个按钮 您必须使用command lambda lab 1 configure text 0 但是当我使用了一个标签时 你会如何将值打印到标签上for循环在嵌入
  • 如何在iOS中的prepareForSegue之前执行按钮按下动作?

    我正在创建一个 iOS 应用程序 在运行方法prepareForSegue 之前 我想在按下按钮时执行分配操作 我使用主要故事板创建了所有控件 某些按钮的执行顺序是 按钮按下动作 gt prepareForSegue 但对于某些按钮来说是
  • Asp.net cookieless sessionId url 位置

    我正在开发一个移动网站 我们不能依靠手机访问该网站来获得 cookie 支持 我正在对会话使用 cookieless 选项 想知道是否有办法指定 sessionId 在 URL 中的放置位置 现在看起来是这样的 http www somes
  • NASM:远程调用,段和偏移量存储在寄存器中

    我已经将代码段和偏移值存储在两个寄存器中 比如说AX and BX分别 在 NASM 中 我如何编码远程调用AX BX 我试过call AX BX 但我得到了错误invalid combination of opcode and opera
  • 用 Pandas 数据框中尽可能少的日期填充缺失的日期值

    我有一个带有日期列的数据框 df pd DataFrame date 2014 10 01 np nan 2015 09 30 np nan np nan 2019 06 03 现在我想用 pandas 中尽可能少的日期值来估算缺失的日期值