将数据从一个 pandas 数据帧替换为另一个

2024-01-07

我有两个数据框 df1 和 df2 。它们都包含时间序列数据，因此 df1 和 df2 中的某些日期可能彼此相交，而其余日期则不相交。我的要求是对两个数据帧进行操作，将 df1 中的值替换为 df2 中相同日期的值，仅保留 df1 中不存在于 df2 中的索引值，并添加 df2 中存在但不存在于 df1 中的索引值。考虑以下示例：

df1:
    A   B   C   D
0   A0  BO  C0  D0
1   A1  B1  C1  D1
2   A2  B2  C2  D2
3   A3  B3  C3  D3

df2:
    A   B   C   E
1   A4  B4  C4  E4
2   A5  B5  C5  E5
3   A6  B6  C6  E6
4   A7  B7  C7  E7

result df:
    A   B   C   D   E
0   A0  BO  C0  D0  Nan
1   A4  B4  C4  D4  E4
2   A5  B5  C5  D5  E5
3   A6  B6  C6  D6  E6
4   A7  B7  C7  D7  E7

我尝试通过第一步连接两个 dfs 来开发逻辑，但这会导致行具有重复索引，并且不确定如何处理该问题。如何才能实现这一目标？任何建议都会有所帮助

编辑：更简单的情况是两个数据框中的列名称相同。因此，考虑 df2 具有 D 列而不是 E 列，其值为 D4、D5、D6、D7。

串联产生以下结果：

concat(df1,df2,axis=1)
    A    B    C    D    A    B    C    D
0   A0   B0   C0   D0  NaN  NaN  NaN  NaN  
1   A1   B1   C1   D1   A4   B4   C4   D4
2   A2   B2   C2   D2   A5   B5   C5   D5
3   A3   B3   C3   D3   A6   B6   C6   D6
4  NaN  NaN  NaN  NaN   A7   B7   C7   D7

现在这引入了重复的列。传统的解决方案是循环遍历每一列，但我正在寻找更优雅的解决方案。任何想法，将不胜感激。

update http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.update.html将对齐两个 DataFrame 的索引：

df1.update(df2)

df1:
    A   B   C   D
0   A0  BO  C0  D0
1   A1  B1  C1  D1
2   A2  B2  C2  D2
3   A3  B3  C3  D3

df2:
    A   B   C   D
1   A4  B4  C4  D4
2   A5  B5  C5  D5
3   A6  B6  C6  D6
4   A7  B7  C7  D7

>>> df1.update(df2)
    A   B   C   D
0  A0  BO  C0  D0
1  A4  B4  C4  D4
2  A5  B5  C5  D5
3  A6  B6  C6  D6

然后，您需要添加 df2 中 df1 中不存在的值：

>>> df1.append(df2.loc[[i for i in df2.index if i not in df1.index], :])
Out[46]: 
    A   B   C   D
0  A0  BO  C0  D0
1  A4  B4  C4  D4
2  A5  B5  C5  D5
3  A6  B6  C6  D6
4  A7  B7  C7  D7

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

将数据从一个 pandas 数据帧替换为另一个的相关文章

docker 容器中的“（pygame parachute）分段错误”

尝试在 docker 容器中使用 pygame 时出现以下错误我想从容器中获取显示 Fatal Python error pygame parachute Segmentation Fault 重现 Docker已安装 docker ru
使用管理员权限打开cmd（Windows 10）

我有自己的 python 脚本来管理我的计算机上的 IP 地址它主要在命令行 Windows 10 中执行netsh命令您必须具有管理员权限这是我自己的计算机我是管理员运行脚本时我已经使用管理员类型的用户 Adrian 登录我无
Scrapy 文件管道不下载文件

我的任务是构建一个可以下载所有内容的网络爬虫 pdfs 在给定站点中 Spider 在本地计算机和抓取集线器上运行由于某种原因当我运行它时它只下载一些但不是全部的 pdf 通过查看输出中的项目可以看出这一点JSON 我已经设定MEDI
动态字段取决于 WTForms 的先前字段

我正在使用 WTForms 制作表格目前我有这个 class UploadForm flask wtf Form fichier wtforms fields FileField u Fichier description wtform
Python speedtest.net，或等效的[关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案是否有一个 Python 库可以实现 SpeedTest net 测试或等效的互联网连接速度测试 GitHub上有一个项目叫速度检查 https gi
在 Python 中从 Excel 复制 YEARFRAC() 函数

因此我使用 python 来自动执行一些必须在 Excel 中执行的重复任务我需要做的计算之一需要使用yearfrac 这在Python中被复制了吗 I found this https lists oasis open org arc
列表推导式和 for 循环中的 Lambda 表达式[重复]

这个问题在这里已经有答案了我想要一个 lambda 列表作为一些繁重计算的缓存并注意到这一点 gt gt gt j for j in lambda i for i in range 10 9 9 9 9 9 9 9 9 9 9 Alt
multiprocessing.Queue 中的 ctx 参数

我正在尝试使用 multiprocessing Queue 模块中的队列实施 https docs python org 3 4 library multiprocessing html exchang objects Between p
在 django 中导入设置时出现奇怪的错误

我有很多项目在 ubuntu 中使用 python2 7 和 virtualenv virtualenvwrapper 工作在我的工作中一些开发人员使用 macosx 和 windows 通常我像往常一样创建项目 django admi
Python在没有pandas的情况下解码excel表

我正在尝试在 python 中读取 excel 文件而不使用pandas or xlrd 我一直在尝试将结果转换为bytes to utf 8没有任何成功 xls 文件中的数据 colA colB colC spc 1D0 20190705
将图与热图（可能是对数）配对？

How to create a pair plot in Python like the following but with heat maps instead of points or instead of a hex bin plot
哪种方式最适合Python工厂注册？

这是一个关于这些方法中哪一种被认为是最有效的问题 Pythonic 我不是在寻找个人意见而是在寻找惯用的观点我的背景不是Python 所以这会对我有帮助我正在开发一个可扩展的 Python 3 项目这个想法类似于工厂模式只不过它是
Python：导入模块一次然后与多个文件共享

我有如下文件 file1 py file2 py file3 py 假设这三个都使用 lib7 py lib8 py lib9 py 目前这三个文件中的每一个都有以下行 import lib7 import lib8 import lib
AttributeError: 'super' 对象没有属性 '__getattr__' 在 Kivy 中使用带有多个 kv 文件的 BoxLayout 时出错

我很清楚这个问题已经被问过好几次了但尝试以下解决方案后 Python Kivy AttributeError 尝试获取 self ids 时 super 对象没有属性 getattr https stackoverflow com qu
将 Django 中的所有视图限制为经过身份验证的用户

我是 Django 新手我正在开发一个项目该项目有一个登录页面作为其索引和一个注册页面其余页面都必须仅限于登录用户如果未经身份验证的用户尝试访问这些页面则必须将他她重定向到登录页面我看到 login required装饰器会将
用 pandas DataFrame 替换 mysql 数据库表中的行

Python 版本 2 7 6 熊猫版本 0 17 1 MySQLdb 版本 1 2 5 在我的数据库中 PRODUCT 我有一张桌子 XML FEED 表 XML FEED 很大数百万条记录我有一个 pandas DataFrame
为什么从 openAI 导入 Universe 模块时出现“无效语法”错误

当我导入时universe来自 openAI 的模块我收到以下错误 Traceback most recent call last File
检查 IP 地址是否在给定范围内

我想检查一下是否有IP180 179 77 11位于特定范围之间例如180 179 0 0 180 179 255 255 我编写了一个函数它将每个 IP 八位字节与其他八位字节进行比较 def match mask IP min ip
超过两个点的Python相对导入

是否可以使用路径中包含两个以上点的模块引用就像这个例子一样 Project structure sound init py codecs init py echo init py nix init py way1 py way2 py w
使用 python 将 CSV 文件上传到 Microsoft Azure 存储帐户

我正在尝试上传一个 csv使用 python 将文件写入 Microsoft Azure 存储帐户我已经发现C sharp https blogs msdn microsoft com jmstall 2012 08 03 convert

随机推荐

支持多窗口检票口 6.x

您好我正在使用检票口当打开两个页面时页面就会过期并且我正在尝试在另一个页面之后提交有没有办法在 wicket 6 8 中支持 getPageSettings setAutomaticMultiWindowSupport true
如何在Windows 64位上安装cmake

cmake 的下载页面仅显示适用于 Windows 的 32 位安装程序知道如何在 64 位 Windows 系统上安装它确实没有理由使用 64 位本机 CMake CMake 只是构建配置因此您可以使用它来构建 64 位软件的配置
如何检测用户何时启动另一个应用程序？（安卓）

我正在尝试构建一个应用程序我的应用程序在后台运行并检测用户何时启动另一个应用程序以便我可以控制其中的流程为了说明我的查询我想指定一个示例我的应用程序在后台运行例如作为服务并且用户刚刚单击应用程序 XYZ 我的应用程序是否可以检
Java 环境位置“不是有效标识符”

我正在尝试在 hadoop env sh 文件中手动设置 JAVA HOME 变量但根据 Cygwin 我的 Java bin 文件的路径不是有效的标识符我收到以下错误消息我相信我已正确转义所有特殊字符 S W27 cygdrive
用 g++ 编译的奇怪代码

以下代码使用 g 4 8 1 成功编译 int main int 它看起来像一个函数指针的简单声明 int f 它不能与 clang 3 4 和 vc 2013 一起编译这是编译器错误还是标准的黑暗之处之一使用 g 4 8 1 可以正常
COM Interop、RPC 服务器在 C# 中不可用

我正在使用 COM Interop 并且正在从 interop dll 实例化 COM 类对象因此有几次对象会成功实例化并进行远程过程调用没有任何问题但有时会抛出异常例如 RPC Server 不可用我使用的 COM 组件是用
使用 webview 启动 Activity 时，应用程序崩溃并显示“致命信号 5 (SIGTRAP)，tid 13058 中的代码 1 (Chrome_InProcRe)”

有时应用程序会崩溃Activity with a webview已开始 Logcat 包含以下消息 4982 11924 I ActivityManager START u0 cmp com ssp software fairstays u
在 Laravel 上本地化日期的最佳方式是什么？

举个例子 article gt created at gt format M 它返回Nov 我需要将其本地化为我的语言因此输出应该是Kas 考虑做以下事情 trans language article gt created at gt f
如何从 git 中的不同远程分支拉取

我正在尝试从远程名为 front 的分支之一拉取名为 back 的分支 git checkout front git pull 但我收到错误消息例如 Please specify which branch you want to merg
使用 imagewebp 将 jpg 转换为 webp

我在使用 imagewebp 将图像转换为 webp 时遇到问题我使用这段代码 filename dirname FILE example jpg im imagecreatefromjpeg filename webp imageweb
为什么在 R 中的 deepnet 包中使用 nn.predict 进行预测会返回恒定值？

我与CIFAR 10 数据集 http www cs utoronto ca kriz cifar html 这是我准备数据的方法 library R matlab A1 lt readMat data batch 1 mat A2 lt
使用 Javascript 删除 Google Drive 中的文件

我正在尝试使用适用于 JavaScript 的 GDriver API 删除文件这个页面看起来直接退出了但它不起作用 https developers google com drive v2 reference files delete
在具有相等空间分布的弹性项目之间添加分界线

我有一个包含不同项目的列表这些项目具有自动宽度在我的情况下不能给出固定宽度我用justify content space between因为我的第一个项目必须从容器的开头开始最后一个项目必须从容器的末尾开始上述所有方法都工作正常
Django 上传文件不在 MEDIA_ROOT 路径中给我 SuspiciousOperation 错误

我想将文件上传到仍在我的 django 项目中的路径但在我的MEDIA ROOT path 当我尝试这样做时我得到了SuspiciousOperation错误以下是我的设置文件中定义的路径 MEDIA ROOT os path joi
使用 Javascript 下载 HTTP 文件

有没有办法在Javascript中下载远程网站即像Curl一样将其读入字符串变量并进一步处理它您只能从同一域下载文件根据同源政策 http en wikipedia org wiki Same origin policy 不过
微前端/Web 组件/Vue 路由器错误：未捕获类型错误：无法重新定义属性：$router

我遇到了一个问题以下是场景我开发了一个vue 应用程序 my admin 微应用程序它有 4 5 个屏幕组件管理用户管理通知管理角色等我创建了一个路由器 js我写了以下内容 imports Vue use VueRouter
是否可以仅通过 HTML/JavaScript 从 Internet Explorer 中呈现的页面打开 Microsoft Edge？

Windows 10 附带现代 Microsoft Edge 浏览器和旧版 Internet Explorer 11 根据分析我怀疑我的一些 Windows 10 用户使用 IE11 并且可能不知道有 Edge 浏览器如果用户使用 Wi
Xcode 上的 Swift._ArrayBuffer._copyContents

Swift ArrayBuffer copyContents initializing Swift UnsafeMutableBufferPointer a gt Swift IndexingIterator a
在 Django 中获取 POST 值

我有一个ajax提交 GET询问但它改变了我的数据库所以聪明的人告诉我我应该使用POST而是用 csfr token 获取查询 document on submit follow function e var button this f
将数据从一个 pandas 数据帧替换为另一个

我有两个数据框 df1 和 df2 它们都包含时间序列数据因此 df1 和 df2 中的某些日期可能彼此相交而其余日期则不相交我的要求是对两个数据帧进行操作将 df1 中的值替换为 df2 中相同日期的值仅保留 df1 中不存在于

将数据从一个 pandas 数据帧替换为另一个

将数据从一个 pandas 数据帧替换为另一个 的相关文章

随机推荐

热门标签

将数据从一个 pandas 数据帧替换为另一个的相关文章