通过比较日期合并数据框，Pandas

2024-02-18

我有两个数据框，我想通过比较不同列上的日期来合并它们。

这是列出了工作单位和日期的数据框。累计工作量表示工人之前完成的工作数量。该工作单位的领导者被识别为领导者姓名。

Work_unit    Date      leader_name  Cum_work

unit1       11/12/2017      Bob           2
unit2       12/14/2018      David         1
unit3       12/13/2019      Ada           3
unit4       1/1/2019        Bob           3
unit5       12/13/2019      Ada           4

这是另一个数据框，显示每个任务的协作者。日期表示该协作者完成任务的日期。

Work_unit     Date      collaborators 

unit2       12/13/2018      Bob
unit2       12/30/2018      Ada
unit3       1/10/2019       Bob
unit3       2/3/2019        Casey
unit4       12/30/2020      Ada
unit4       12/31/2020      David

我想结合两个数据框来演示工作协作并显示协作者的资历。

例如，Bob 是工作单元 1 的领导者，但他也是单元 2 的协作者。我想通过比较日期将 Bob 的累积工作从 dataframe1（他完成的领导工作数量）映射到 dataframe2，因此 Cumworks_sofar 将单元 2 中的 Bob 为 2。

因此合并后的数据框将是

Work_unit     Date   collaborators   Cumworks_sofar

unit2       12/13/2018      Bob              2
unit2       12/30/2018      Ada              3
unit3       1/10/2019       Bob              3
unit3       2/3/2019        Casey            0
unit4       12/30/2020      Ada              4
unit4       12/31/2020      David            1

感谢您的帮助

merge_asof with backward方向，

df1.sort_values(by=['Date'], inplace=True)

output = pd.merge_asof(df2, df1, on='Date', left_by='collaborators', right_by='leader_name', direction='backward')
output.drop(['Work_unit_y', 'leader_name'], axis=1, inplace=True)
output.rename(columns={'Work_unit_x': 'Work_unit'}, inplace=True)
output
###
  Work_unit       Date collaborators  Cum_work
0     unit2 2018-12-13           Bob       2.0
1     unit2 2018-12-30           Ada       NaN
2     unit3 2019-01-10           Bob       3.0
3     unit3 2019-02-03         Casey       NaN
4     unit4 2020-12-30           Ada       4.0
5     unit4 2020-12-31         David       1.0

我认为Ada的第一张唱片应该是无唱片，因为她之前没有工作过2018-12-30 since Cum_work是一个累积指标。

如果Ada问题解决了，最后一部分就是填写NaN:

output.fillna(0, inplace=True)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

date

MERGE

通过比较日期合并数据框，Pandas 的相关文章

如何在flask中使用g.user全局

据我了解 Flask 中的 g 变量它应该为我提供一个全局位置来存储数据例如登录后保存当前用户它是否正确我希望我的导航在登录后在整个网站上显示我的用户名我的观点包含 from Flask import g among other
为 Anaconda Python 安装 psycopg2

我有 Anaconda Python 3 4 但是每当我运行旧代码时我都会通过输入 source activate python2 切换到 Anaconda Python 2 7 我的问题是我为 Anaconda Python 3 4 安
Python（Selenium）：如何通过登录重定向/组织登录登录网站

我不是专业程序员所以请原谅任何愚蠢的错误我正在做一些研究我正在尝试使用 Selenium 登录数据库来搜索大约 1000 个术语我有两个问题 1 重定向到组织登录页面后如何使用 Selenium 登录 2 如何检索数据库在我解决
使用 matplotlib 绘制时间序列数据并仅在年初显示年份

rcParams date autoformatter month b n Y 我正在使用 matpltolib 来绘制时间序列如果我按上述方式设置 rcParams 则生成的图会在每个刻度处标记月份名称和年份我怎样才能将其设置为仅在每
PyUSB 1.0：NotImplementedError：此平台不支持或未实现操作

我刚刚开始使用 pyusb 基本上我正在玩示例代码here https github com walac pyusb blob master docs tutorial rst 我使用的是 Windows 7 64 位并从以下地址下载 z
如何替换 pandas 数据框列中的重音符号

我有一个数据框dataSwiss其中包含瑞士城市的信息我想用普通字母替换带有重音符号的字母这就是我正在做的 dataSwiss Municipality dataSwiss Municipality str encode utf 8 d
python 相当于 R 中的 get() （= 使用字符串检索符号的值）

在 R 中 get s 函数检索名称存储在字符变量向量中的符号的值s e g X lt 10 r lt XVI s lt substr r 1 1 X get s 10 取罗马数字的第一个符号r并将其转换为其等效整数尽管花了一些时间翻
Python pickle：腌制对象不等于源对象

我认为这是预期的行为但想检查一下也许找出原因因为我所做的研究结果是空白我有一个函数可以提取数据创建自定义类的新实例然后将其附加到列表中该类仅包含变量然后我使用协议 2 作为二进制文件将该列表腌制到文件中稍后我重新运行脚本
添加不同形状的 numpy 数组

我想添加两个不同形状的 numpy 数组但不进行广播而是将缺失值视为零可能最简单的例子是 1 2 3 2 gt 3 2 3 or 1 2 3 2 1 gt 3 2 3 1 0 0 我事先不知道形状我正在弄乱每个 np shape
Pygame：有没有简单的方法可以找到按下的任何字母数字的字母/数字？

我目前正在开发的游戏需要让人们以自己的名义在高分板上计时我对如何处理按键有点熟悉但我只处理过寻找特定的按键有没有一种简单的方法可以按下任意键的字母而不必执行以下操作 for event in pygame event get if
在f字符串中转义字符[重复]

这个问题在这里已经有答案了我遇到了以下问题f string gt gt gt a hello how to print hello gt gt gt f a a gt gt gt f a File
无法在 Python 3 中导入 cProfile

我试图将 cProfile 模块导入 Python 3 3 0 但出现以下错误 Traceback most recent call last File
Pandas：merge_asof() 对多行求和/不重复

我正在处理两个数据集每个数据集具有不同的关联日期我想合并它们但因为日期不完全匹配我相信merge asof 是最好的方法然而有两件事发生merge asof 不理想的数字重复数字丢失以下代码是一个示例 df a pd Da
Fabric env.roledefs 未按预期运行

On the 面料网站 http docs fabfile org en 1 10 usage execution html 给出这个例子 from fabric api import env env roledefs web hosts
Python：如何将列表列表的元素转换为无向图？

我有一个程序可以检索 PubMed 出版物列表并希望构建一个共同作者图这意味着对于每篇文章我想将每个作者如果尚未存在添加为顶点并添加无向边或增加每个合著者之间的权重我设法编写了第一个程序该程序检索每个出版物的作者列表并
如何计算 pandas 数据帧上的连续有序值

我试图从给定的数据帧中获取连续 0 值的最大计数其中包含来自 pandas 数据帧的 id date value 列如下所示 id date value 354 2019 03 01 0 354 2019 03 02 0 354 201
使用其构造函数初始化 OrderedDict 以便保留初始数据的顺序的正确方法？

初始化有序字典 OD 以使其保留初始数据的顺序的正确方法是什么 from collections import OrderedDict Obviously wrong because regular dict loses order d O
Scrapy：如何使用元在方法之间传递项目

我是 scrapy 和 python 的新手我试图将 parse quotes 中的项目 item author 传递给下一个解析方法 parse bio 我尝试了 request meta 和 response meta 方法如 sc
使用 MongoDB 和 Nodejs 插入和查询日期

我需要一些帮助在 mongodb 和 nodejs 中按日期查找记录我将日期添加到抓取脚本中的 json 对象如下所示 jsonObj last updated new Date 该对象被插入到 mongodb 中我可以看到如下 la
Statsmodels.formula.api OLS不显示截距的统计值

我正在运行以下源代码 import statsmodels formula api as sm Add one column of ones for the intercept term X np append arr np ones 50

随机推荐

c 获取整数的第n个字节

我知道你可以通过使用获得第一个字节 int x number 1 lt lt 8 1 or int x number 0xFF 但我不知道如何获取整数的第 n 个字节例如 1234 为 32 位整数 00000000 00000000 0
git-stitch-import：如何创建一个主分支？

我正在尝试将多个 git 存储库合并到一个新存储库中每个旧存储库作为新存储库中的子目录 git stitch repo 似乎是我想要的工具但是文档不太清楚我能够遵循它 https metacpan org pod distribut
this()在Java中意味着什么[重复]

这个问题在这里已经有答案了什么是this 在Java中是什么意思看起来只有放置时才有效 this 在类变量区中有人对此有想法吗 Thanks 这意味着您正在从另一个构造函数调用默认构造函数它必须是第一个语句如果有则不能使用 su
如何在 Android 中制作 FM 收音机应用程序 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案这只是出于好奇有什么办法可以让我们调频广播应用程序适用于 Android 设备我知道这是可能的因
对象默认的stringify，相当于Java的toString？

我刚刚看了 dart 的 3 教程创建了评级组件我想知道在字符串化对象时是否调用相同的方法类似于Java的toString 例如 MyClass myObject new MyClass System out println myOb
如何编写正确的静态方法 - 多线程安全

因为我认为静态方法不应该像第一个片段那样编写还是我错了 public static class ExtensionClass private static SomeClass object1 private static StringBu
使用 msiexec 和 c# 安装 msi

在静默模式下在 C 应用程序中安装 msi 的最佳方法是什么我想使用 msiexec 安装 msi 文件但我不知道如何执行此操作问题是使用 msiexec 和 qn 时您必须在 cmd exe 进程中运行它以以管理员身份启动
laravel 中会话超时或过期后触发函数

我有一个关于身份验证的问题我的身份验证控制器中有以下功能 public function signout set logged in status to zero in database l Login where user id Ses
一页上有多个谷歌地图

在一页上显示多个实体每个实体都有一个谷歌地图这就是我处理仅显示一个实体的地图的方式 var map var geocoder document ready function google maps event addDomListene
您何时以及为何使用 Java 的供应商和消费者接口？

作为一名学习 Java 的非 Java 程序员我正在阅读Supplier and Consumer目前的接口我无法理解它们的用法和含义您何时以及为何使用这些接口有人可以给我一个简单的外行例子吗我发现文档示例对于我的理解来说不够简洁
在未排序的列表中查找序列

So I am given an unsorted list A a1 a2 an with n distinct elements My goal here is to find the middle index i 1 lt i lt
Angular：收集的元数据包含将在运行时报告的错误：不支持 Lambda

在我的 Angular 应用程序中我尝试使用工厂供应商 https angular io guide dependency injection providers factory providers在我的模块中 export functi
如何将 rgba 转换为透明度调整的十六进制？

我想知道如何转换rgba into hex以将可见的 rgba 颜色包括透明度转换为十六进制值的方式假设我有这个 rgba 0 129 255 4 有点像浅蓝色我想知道是否有办法获得相同的十六进制浅蓝色可见颜色所以我不想要转
Facebook: FB 登录时黑屏

当我尝试通过 Facebook 登录时我的应用程序突然发生了一件奇怪的事情询问登录详细信息后 Facebook 连接弹出对话框将显示空白屏幕通常情况下我希望看到窗口关闭然后网站本身会继续运行但它似乎已挂起我在用Javascri
在 Jekyll 中显示文件名并突出显示 Pygments 代码

当在已知位置突出显示标准文件时我想将文件名放在代码块中最好在顶部一个假设的例子是 highlight apache show filename etc httpd conf httpd conf the file contents e
使用 Laravel 和 Angular 4 问题通过 API 在数据库中保存文件

我有 2 个问题 1 当我发送文件请求时保存附件方法为空 2 我的程序可以将文件以二进制形式保存在数据库中吗 Laravel 迁移 class CreateAttachmentsTable extends Migration public
React.js 错误：服务工作人员导航预加载请求在“preloadResponse”解决之前被取消

我的 React 应用程序使用 Redux Saga 有问题我收到控制台错误 The service worker navigation preload request was cancelled before preloadRespo
如何在 Java 中读取格式良好的 XML，但跳过架构？

我想读取其中包含架构声明的 XML 文件这就是我想做的一切阅读它我不在乎它是否有效但我希望它结构良好问题是读取器尝试读取架构文件但失败了我什至不想尝试我已尝试禁用验证但它仍然坚持尝试读取架构文件理想情况下我想使用现有的
测地线球的算法

我必须用较小的均匀分布的球制作一个球体我认为最佳方法是构建一个基于三角形的测地球体并使用顶点作为球的中点但我无法编写生成顶点的算法用 C 或伪代码回答会更好测地线球体示例 https i stack imgur com iNQfP
通过比较日期合并数据框，Pandas

我有两个数据框我想通过比较不同列上的日期来合并它们这是列出了工作单位和日期的数据框累计工作量表示工人之前完成的工作数量该工作单位的领导者被识别为领导者姓名 Work unit Date leader name Cum work un

通过比较日期合并数据框，Pandas

通过比较日期合并数据框，Pandas 的相关文章

随机推荐

热门标签