Pandas 在“datetimeIndex”中的“datetime”或“datetime”上合并

2023-11-21

目前我有两个代表 Excel 电子表格的数据框。我希望加入日期相等的数据。这是一对多联接，因为一个电子表格有一个日期，然后我需要添加具有相同日期的多行的数据

一个例子：

            A                  B
     date     data       date                 data
0    2015-0-1 ...     0  2015-0-1 to 2015-0-2 ...
1    2015-0-2 ...     1  2015-0-1 to 2015-0-2 ...

在这种情况下，A 中的两行都会收到 B 中的行 0 和 1，因为它们在该范围内。

我尝试使用

df3 = pandas.merge(df2, df1, how='right', validate='1:m', left_on='Travel Date/Range', right_on='End')

来完成此操作但收到此错误。

Traceback (most recent call last):
  File "<pyshell#61>", line 1, in <module>
    df3 = pandas.merge(df2, df1, how='right', validate='1:m', left_on='Travel Date/Range', right_on='End')
  File "C:\Users\M199449\AppData\Local\Programs\Python\Python36\lib\site-packages\pandas\core\reshape\merge.py", line 61, in merge
    validate=validate)
  File "C:\Users\M199449\AppData\Local\Programs\Python\Python36\lib\site-packages\pandas\core\reshape\merge.py", line 555, in __init__
    self._maybe_coerce_merge_keys()
  File "C:\Users\M199449\AppData\Local\Programs\Python\Python36\lib\site-packages\pandas\core\reshape\merge.py", line 990, in _maybe_coerce_merge_keys
    raise ValueError(msg)
ValueError: You are trying to merge on object and datetime64[ns] columns. If you wish to proceed you should use pd.concat

当然，我可以根据需要添加更多信息

所以这是合并的选项：

假设您有两个 DataFrame：

import pandas as pd
df1 = pd.DataFrame({'date': ['2015-01-01', '2015-01-02', '2015-01-03'], 
                    'data': ['A', 'B', 'C']})
df2 = pd.DataFrame({'date': ['2015-01-01 to 2015-01-02', '2015-01-01 to 2015-01-02', '2015-01-02 to 2015-01-03'], 
                    'data': ['E', 'F', 'G']})

现在进行一些清理以获取您需要的所有日期并确保它们是datetime

df1['date'] = pd.to_datetime(df1.date)

df2[['start', 'end']] = df2['date'].str.split(' to ', expand=True)
df2['start'] = pd.to_datetime(df2.start)
df2['end'] = pd.to_datetime(df2.end)
# No need for this anymore
df2 = df2.drop(columns='date')

现在将它们全部合并在一起。您将获得 99x10K 行。

df = df1.assign(dummy=1).merge(df2.assign(dummy=1), on='dummy').drop(columns='dummy')

以及落在范围之间的日期的子集：

df[(df.date >= df.start) & (df.date <= df.end)]
#        date data_x data_y      start        end
#0 2015-01-01      A      E 2015-01-01 2015-01-02
#1 2015-01-01      A      F 2015-01-01 2015-01-02
#3 2015-01-02      B      E 2015-01-01 2015-01-02
#4 2015-01-02      B      F 2015-01-01 2015-01-02
#5 2015-01-02      B      G 2015-01-02 2015-01-03
#8 2015-01-03      C      G 2015-01-02 2015-01-03

例如，如果某些日期df2是单个日期，因为我们正在使用.str.split我们将得到None第二次约会。然后只需使用.loc来适当地设置它。

df2 = pd.DataFrame({'date': ['2015-01-01 to 2015-01-02', '2015-01-01 to 2015-01-02', '2015-01-02 to 2015-01-03',
                             '2015-01-03'], 
                    'data': ['E', 'F', 'G', 'H']})

df2[['start', 'end']] = df2['date'].str.split(' to ', expand=True)
df2.loc[df2.end.isnull(), 'end'] = df2.loc[df2.end.isnull(), 'start']
#  data      start        end
#0    E 2015-01-01 2015-01-02
#1    F 2015-01-01 2015-01-02
#2    G 2015-01-02 2015-01-03
#3    H 2015-01-03 2015-01-03

现在其余部分保持不变

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

Pandas 在“datetimeIndex”中的“datetime”或“datetime”上合并的相关文章

在 python 程序中合并第三方库的最佳实践是什么？

下午好我正在为我的工作编写一个中小型Python程序该任务需要我使用 Excel 库xlwt and xlrd 以及一个用于查询 Oracle 数据库的库称为CX Oracle 我正在通过版本控制系统即CVS 开发该项目我想知道围
Python 的键盘中断不会中止 Rust 函数 (PyO3)

我有一个使用 PyO3 用 Rust 编写的 Python 库它涉及一些昂贵的计算单个函数调用最多需要 10 分钟从 Python 调用时如何中止执行 Ctrl C 好像只有执行结束后才会处理所以本质上没什么用最小可重现示例 Ca
Django 管理员在模型编辑时间歇性返回 404

我们使用 Django Admin 来维护导出到我们的一些站点的一些数据有时当单击标准更改列表视图来获取模型编辑表单而不是路由到正确的页面时我们会得到 Django 404 页面模板它是偶尔发生的我们可以通过重新加载三次来重现它
使 django 服务器可以在 LAN 中访问

我已经安装了Django服务器可以如下访问 http localhost 8000 get sms http 127 0 0 1 8000 get sms 假设我的IP是x x x x 当我这样做时从同一网络下的另一台电脑 my ip
使用 matplotlib 绘制时间序列数据并仅在年初显示年份

rcParams date autoformatter month b n Y 我正在使用 matpltolib 来绘制时间序列如果我按上述方式设置 rcParams 则生成的图会在每个刻度处标记月份名称和年份我怎样才能将其设置为仅在每
Flask 会话变量

我正在用 Flask 编写一个小型网络应用程序当两个用户在同一网络下尝试使用应用程序时我遇到会话变量问题这是代码 import os from flask import Flask request render template
如何使用 Ansible playbook 中的 service_facts 模块检查服务是否存在且未安装在服务器中？

我用过service facts检查服务是否正在运行并启用在某些服务器中未安装特定的软件包现在我如何知道这个特定的软件包没有安装在该特定的服务器上service facts module 在 Ansible 剧本中它显示以下错误
是否可以忽略一行的pyright检查？

我需要忽略一行的pyright 检查有什么特别的评论吗 def create slog group SLogGroup data Optional dict None SLog insert one SLog group group da
SQLALchemy .query：类“Car”的未解析属性引用“query”

我有一个这里已经提到的问题https youtrack jetbrains com issue PY 44557 https youtrack jetbrains com issue PY 44557 但我还没有找到解决方案我使用 Pyt
测试 python Counter 是否包含在另一个 Counter 中

如何测试是否是pythonCounter https docs python org 2 library collections html collections Counter is 包含在另一个中使用以下定义柜台a包含在计数器中b当且
Spark KMeans 无法处理大数据吗？

KMeans 有几个参数training http spark apache org docs latest api python pyspark mllib html highlight kmeans pyspark mllib clus
Python 函数可以从作用域之外赋予新属性吗？

我不知道你可以这样做 def tom print tom s locals locals def dick z print z name z name z guest Harry print z guest z guest print di
如何在ipywidget按钮中显示全文？

我正在创建一个ipywidget带有一些文本的按钮但按钮中未显示全文我使用的代码如下 import ipywidgets as widgets from IPython display import display button wid
IO 密集型任务中的 Python 多线程

建议仅在 IO 密集型任务中使用 Python 多线程因为 Python 有一个全局解释器锁 GIL 只允许一个线程持有 Python 解释器的控制权然而多线程对于 IO 密集型操作有意义吗 https stackoverflow c
Jupyter Notebook 内核一直很忙

我已经安装了 anaconda 并且 python 在 Spyder IPython 等中工作正常但是我无法运行 python 笔记本内核被创建它也连接但它始终显示黑圈忙碌符号防火墙或防病毒软件没有问题我尝试过禁用两者我也无法
如何在 Python 中追加到 JSON 文件？

我有一个 JSON 文件其中包含 67790 1 kwh 319 4 现在我创建一个字典a dict我需要将其附加到 JSON 文件中我尝试了这段代码 with open DATA FILENAME a as f json obj js
为字典中的一个键附加多个值[重复]

这个问题在这里已经有答案了我是 python 新手我有每年的年份和值列表我想要做的是检查字典中是否已存在该年份如果存在则将该值附加到特定键的值列表中例如我有一个年份列表并且每年都有一个值 2010 2 2009 4 1989
解释 Python 中的数字范围

在 Pylons Web 应用程序中我需要获取一个字符串例如关于如何做到这一点有什么建议吗我是 Python 新手我还没有找到任何可以帮助解决此类问题的东西该列表将是 1 2 3 45 46 48 49 50 51 77 使用
Rocket UniData/UniVerse：ODBC 无法分配足够的内存

每当我尝试使用pyodbc连接到 Rocket UniData UniVerse 数据时我不断遇到错误 pyodbc Error 00000 00000 Rocket U2 U2ODBC 0302810 Unable to allocate
如何使用 Pycharm 安装 tkinter？ [复制]

这个问题在这里已经有答案了 I used sudo apt get install python3 6 tk而且效果很好如果我在终端中打开 python Tkinter 就可以工作但我无法将其安装在我的 Pycharm 项目上 pip

随机推荐

为什么macos(x86)可以运行docker arm容器arm64v8/alpine？

我碰巧发现我的macos x86 可以为arm镜像arm64v8 alpine运行docker容器但有以下警告 docker run it arm64v8 alpine uname a WARNING The requested imag
JavaFX完全定制windows？

我想要一个完全自定义窗口外观的应用程序到目前为止我已经了解到可以使用以下方法删除典型的窗口内容 class Application extends javafx application Application Starts the ap
通过 Eclipse Kepler 启动 tomcat v7 时遇到问题

我看到像我这样的问题以前已经发布过其中一些帖子已得到解答我已经尝试过修复看起来确实应该有效但我仍然遇到同样的问题我正在尝试通过本地主机上的 apache tomcat 7 0 53 在 Eclipse Kepler Java EE
两个子图的单个颜色条会更改其中一个子图的大小

我正在尝试添加一个colorbar两个人matshow主要使用以下代码here and here 我的代码现在如下但问题是颜色条调节了右侧绘图的大小我怎样才能防止这种情况发生 import numpy as np import matp
如何比较大文本文件？

我有一个关于你对我的技术的看法的一般性问题有 2 个文本文件 file 1 and file 2 需要相互比较两者都非常巨大 3 4 GB 每个从 30 000 000 到 45 000 000 行我的想法是阅读几行尽可能多 f
查询计算连续事件之间的平均时间

我的问题是如何编写 SQL 查询来计算连续事件之间的平均时间我有一张小桌子 event Name Time stage 1 10 01 stage 2 10 03 stage 3 10 06 stage 1 10 10 stage 2 1
运行时在 Highcharts 图表中添加按钮

我需要添加一些自定义按钮带有 onclick 事件而不覆盖导出按钮值因为我想包含新按钮而不会丢失图表中先前定义的自定义按钮我的图表已经定义了自定义按钮所有这些都在运行时进行在使用此对象的 Highcharts 图表中容器 h
我不想在 DatePicker 中显示消息“选择日期”

我不想在 DatePicker 的文本框中显示选择日期但我想看到这样的内容或其他文本这是我的资源
什么是“file_like_object”，什么是“文件”； pickle.load() 和 pickle.loads()

我正在弄清楚两者之间的差异pickle load and pickle loads 有人说那是什么样的物体pickle load 进程是 file like object 但是 pickle loads 对应于文件对象您选择使用哪个函数
Internet Explorer 在哪里存储其加载项？

我检查了整个注册表但找不到所有已安装扩展的任何列表此时 IE 扩展附加组件的任何常规位置都会有所帮助取自here 浏览器辅助对象旨在增强浏览器功能的浏览器插件条目可以在注册表中找到 HKEY LOCAL MACHINE Soft
Vim 文本着色

I use echo e为了给我的脚本输出着色它在使用标准输出时工作得很好但是当我将输出重定向到文件时 vim不显示颜色而是显示这样的标志例子 echo e e 32m Green message e 0m echo e e 31m
检查 Facebook 是否被阻止然后重定向 [重复]

这个问题在这里已经有答案了可能的重复通过 JavaScript 检查网站是否正常运行的最佳方法是什么我们即将通过 Facebook 页面开展一项活动理想情况下我们希望将用于此活动的网址例如 www oursite com cam
错误：即使使用 Dispatcher，也必须在与 DependencyObject 相同的线程上创建 DependencySource

以下是我的部分内容View其中我已将图像绑定到我的属性ViewModel
View.GONE 和 View.INVISIBLE 之间有什么区别[重复]

这个问题在这里已经有答案了我正在使用自定义视图在自定义视图上我正在绘制一些图表我还在我的布局上使用 TextView 当我在按钮上单击此 TextView 可见和不可见时是清除图为什么是清除图同时有GONE和INVISIBLE
数据库复制。 2台服务器，主数据库，第二台是只读的

假设您有 2 个数据库服务器其中一个数据库是执行所有写入操作的主数据库它被视为真实原始数据库另一台服务器的数据库将是主数据库从的镜像副本它将用于应用程序某一部分的只读操作如何设置一个从数据库来镜像主数据库上的数据据
elasticsearch：自动节点发现没有发生，遗漏了什么？

在我的同一台机器上我首先运行 elasticsearch f 2014 02 06 10 27 59 066 INFO node Gabe Jones version 0 90 11 pid 1767 build 11da1ba 2014
gcc 的原子操作和代码生成

我正在查看 gcc 为原子操作生成的一些程序集我尝试了以下简短的序列 int x1 int x2 int foo void test atomic store n x1 1 ATOMIC SEQ CST if atomic load n
如何在 MATLAB 中的等高线图的等高线上放置字符串标签

我想知道是否可以使用一组用户定义的字符串来标记 MATLAB 等值线图的等值线我目前正在使用以下代码片段来生成带标签的等高线图 Create Data X 0 01 0 01 0 10 Y 0 01 0 01 0 10 Z repmat
所有消息消费完后如何关闭kafka消费者？

我有以下程序来消耗所有传入 Kafka 的消息 from kafka import KafkaConsumer consumer KafkaConsumer my test topic group id my group bootstrap
Pandas 在“datetimeIndex”中的“datetime”或“datetime”上合并

目前我有两个代表 Excel 电子表格的数据框我希望加入日期相等的数据这是一对多联接因为一个电子表格有一个日期然后我需要添加具有相同日期的多行的数据一个例子 A B date data date data 0 2015 0 1 0

Pandas 在“datetimeIndex”中的“datetime”或“datetime”上合并

Pandas 在“datetimeIndex”中的“datetime”或“datetime”上合并 的相关文章

随机推荐

热门标签

Pandas 在“datetimeIndex”中的“datetime”或“datetime”上合并的相关文章