根据pandas数据框中的关键列减去列

2024-01-08

我有两个数据框看起来像

df1:

   ID    A   B   C   D 
0 'ID1' 0.5 2.1 3.5 6.6
1 'ID2' 1.2 5.5 4.3 2.2
2 'ID1' 0.7 1.2 5.6 6.0 
3 'ID3' 1.1 7.2 10. 3.2

df2:

   ID    A   B   C   D 
0 'ID1' 1.0 2.0 3.3 4.4
1 'ID2' 1.5 5.0 4.0 2.2
2 'ID3' 0.6 1.2 5.9 6.2 
3 'ID4' 1.1 7.2 8.5 3.0

df1 可以有多个相同的条目ID而每个ID在 df2 中仅出现一次。也并非全部IDdf2 中的内容必然存在于 df1 中。我无法通过使用来解决这个问题set_index()因为 df1 中的多行可以具有相同的ID，并且IDdf1 和 df2 中未对齐。

我想创建一个新的数据框，在其中减去其中的值df2[['A','B','C','D']] from df1[['A','B','C','D']]基于匹配 ID。

生成的数据框将如下所示：

df_new:

   ID     A    B   C   D 
0 'ID1' -0.5  0.1 0.2 2.2
1 'ID2' -0.3  0.5 0.3 0.0
2 'ID1' -0.3 -0.8 2.3 1.6
3 'ID3'  0.5  6.0 1.5 0.2

我知道如何用循环来做到这一点，但由于我正在处理大量数据，这根本不实用。使用 Pandas 解决这个问题的最佳方法是什么？

你只需要 set_index 并减去

(df1.set_index('ID')-df2.set_index('ID')).dropna(axis=0)
Out[174]: 
         A    B    C    D
ID                       
'ID1' -0.5  0.1  0.2  2.2
'ID1' -0.3 -0.8  2.3  1.6
'ID2' -0.3  0.5  0.3  0.0
'ID3'  0.5  6.0  4.1 -3.0

如果订单很重要，请添加reindex对于 df2

(df1.set_index('ID')-df2.set_index('ID').reindex(df1.ID)).dropna(axis=0).reset_index()
Out[211]: 
      ID    A    B    C    D
0  'ID1' -0.5  0.1  0.2  2.2
1  'ID2' -0.3  0.5  0.3  0.0
2  'ID1' -0.3 -0.8  2.3  1.6
3  'ID3'  0.5  6.0  4.1 -3.0

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python3x

pandas

DataFrame

根据pandas数据框中的关键列减去列的相关文章

Python，将迭代函数变成递归函数

我创建了一个输出 4 3 2 1 0 1 2 3 4 的迭代函数 def bounce2 n s n for i in range n print n n n 1 if n lt 0 for i in range s 1 print n n
为什么在 Windows 中使用 GetConsoleScreenBufferInfoEx 时控制台窗口会缩小？

我正在尝试使用 GetConsoleScreenBufferInfoEx 和 SetConsoleScreenBufferInfoEx 设置 Windows 命令行控制台的背景和前景色我正在 Python 中使用 wintypes 进行此
为什么导入 pdb 时出现此错误？ “模块”对象没有属性“ascii_letters”

尝试调试我的代码我正在导入库pdb import sys from subprocess import check call import pdb functions if name main Code 我收到此错误 File reg p
html 解析器 python

我正在尝试解析一个网站我正在使用 HTMLParser 模块问题是我想解析第一个 a href 评论后但我真的不知道该怎么做所以我在文档中发现有一个函数叫做handle comment 但我还没有找到如何正确使用它我有以下内容 i
如何使用循环将十进制转换为二进制？

我想编写一个程序将十进制数 0 到 9 转换为二进制数我可以编写如何使用重复除法将十进制数转换为二进制数的代码但是我在创建一个以二进制格式打印十进制数字 0 到 9 的循环时遇到了麻烦这是我的代码 number 0 remaind
如何使用 Pandas 将巨大的 CSV 转换为 SQLite？

我有一个巨大的表大约 60 GB 采用存档的 CSV 文件形式我想将其转换为 SQLite 文件我现在所做的事情如下 import pandas import sqlite3 cnx sqlite3 connect db sqlite
如何在 Scala 中将 DataFrame 模式写入文件

我有一个 DataFrame 它从一个巨大的 json 文件加载并从中获取架构该架构基本上大约有 1000 列我希望将 printSchema 的相同输出保存在文件中而不是控制台中有任何想法吗如果您在本地环境中工作您可以执行以下操
如何从 Python 中指定运行程序的输入文件？

我正在编写一个外部脚本以通过笔记本电脑上的 Python mrjob 模块而不是在 Amazon Elastic Compute Cloud 或任何大型集群上运行 mapreduce 作业我读自mrjob文档 http packag
一起使用 Flask 和 Tornado？

我是以下的忠实粉丝Flask 部分是因为它很简单部分是因为它有很多扩展 http flask pocoo org extensions 然而 Flask 是为了在 WSGI 环境中使用而设计的而 WSGI 不是非阻塞的所以我相信它
如何检查列表是否为空？

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动例如如果通过以下内容 a 我如何检查是否a是空的 if not a print Lis
如何获得没有前缀的虚拟人物？

我想从两个不同的列中获取虚拟数据但没有任何前缀资料说明 X Y 123 AAA 456 BBB 123 AAA 789 CCC 预期结果 X Y 789 456 123 CCC BBB AAA 123 AAA 0 0 1 0 0 1 4
为什么“return self”返回 None ？ [复制]

这个问题在这里已经有答案了我正在尝试获取链的顶部节点getTopParent 当我打印出来时self name 它确实打印出了父实例的名称然而当我回来时self 它返回 None 为什么是这样 class A def init sel
smooth_idf 是多余的吗？

The scikit learn 文档 http scikit learn org stable modules generated sklearn feature extraction text TfidfTransformer html
numpy.cov() 返回意外的输出

我有一个 X 数据集有 9 个特征和 683 行 683x9 我想获取这个 X 数据集和另一个与 X 具有相同形状的数据集的协方差矩阵我使用np cov originalData generatedData rowvar False 代
使用Beam IO ReadFromPubSub模块时，可以在Python中提取带有属性的消息吗？尚不清楚是否支持

尝试将具有存储在 PubSub 中的属性的消息拉取到 Beam 管道中我想知道是否添加了对 Python 的支持这就是我无法阅读它们的原因我看到它存在于Java中 pipeline options PipelineOptions pi
为什么 bot.get_channel() 会产生 NoneType？

我正在制作一个 Discord 机器人来处理公告命令当使用该命令时我希望机器人在特定通道中发送一条消息并向用户发送一条消息以表明该命令已发送但是我无法将消息发送到频道我尝试了这段代码 import discord import
如何设置 matplotlib 表中列的背景颜色

我在一个目录中有多个 txt 文件例如 d memdump 0 txt 1 txt 10 txt 示例文本文件如下 Applications Memory Usage kB Uptime 7857410 Realtime 7857410
最小硬币找零问题——回溯

我正在尝试用最少数量的硬币解决硬币找零问题采用回溯法我实际上已经完成了它但我想添加一些选项按其单位打印硬币数量而不仅仅是总数这是我下面的Python代码 def minimum coins coin list change mi
SQLAlchemy：避免声明式样式类定义中的重复

我正在使用 SQLAlchemy 并且我的对象模型中的许多类具有相同的两个属性 id 和整数和主键以及名称字符串我试图避免在每个类中声明它们如下所示 class C1 declarative base id Column Inte
issubclass() 对从不同路径导入的同一类返回 False

目的是实现某种插件框架其中插件是同一基类即 A 的子类即 B 基类使用标准导入加载而子类使用 imp load module 从众所周知的包即 pkg 的路径加载 pkg init py mod1 py class A mod2

随机推荐

删除 R 图形设备中的所有边距

所以我在摆脱图形设备的整个边距时遇到了一些麻烦我已将 mar 设置为 0 但边缘周围仍然存在一些持久空间例如 plot new par mar c 0 0 0 0 plot window c 0 1 c 0 1 points c 1 1
如何使用 foreachPartition 在 Spark 中为每个分区高效构建一个 ML 模型？

我正在尝试为数据集的每个分区拟合一个 ML 模型但我不知道如何在 Spark 中执行此操作我的数据集基本上是这样的按公司划分 Company Features Target A xxx 0 9 A xxx 0 8 A xxx 1 0 B
C2DM实现PHP代码

我正在创建使用 C2DM 推送通知的 Android 应用程序但我在创建 php 代码以使用 c2dm 发送消息时遇到问题请指导我如何使用 php 代码发送消息实际上存在一个问题即如何获取客户端身份验证令牌我见过http code
ASP.NET MVC：如何设置 web.config 进行 LDAP 身份验证？

我有一个正在运行的 LDAP 服务器其参数如下 OU users OU mydomain O this domain LDAP myhost 389 I 成功地 access 使用通用 LDAP 客户端就像 Jarek Gawor 的
在 LINQ 中实现“不在”（又名“不存在”）逻辑

Setup 我有两个List
Objective C 的 iPhone 开发中的“委托”是什么？ [复制]

这个问题在这里已经有答案了 Objective C 的 iPhone 开发中的委托是什么委托是一个指向对象的指针该对象具有委托持有者知道如何调用的一组方法换句话说就是启用特定回调的机制来自后来创建的对象 A 很好的例子是UIAl
过滤二维数组并从中间返回坐标

我有一个由零组成的二维数组在 1 6 和 2 7 处有一些正整数 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 0
Laravel 4 控制器测试 - 太多 $this->call() 后出现 ErrorException - 为什么？

我非常感谢有关我遇到的 Laravel 4 问题的帮助我正在测试控制器路由特别是负责路由调查问卷响应的控制器我正在测试以下场景用户尝试跳过问题用户请求不存在的问题等等到目前为止我为所有场景编写的测试都可以使用 PHPunit
Skipgrams 上下文（kwic）中的关键字？

我使用 Quanteda 对 ngram 和 token 进行上下文分析中的关键字效果很好我现在想对skipgrams 执行此操作捕获进入障碍的上下文以及和进入障碍下面的代码是一个空的 kwic 对象但我不知道我做错了什么
从 PERL LibXML 解析器获取完整的 XML 字符串

我有以下需要处理的 XML table table
仅使用 GitHub Actions 在特定分支上运行作业

我对 GitHub Actions 比较陌生我有 2 份工作一份运行我的测试另一份将我的项目部署到服务器上显然我希望测试在每个分支上运行但是只有当某些内容被推送到 master 时才应该进行部署我正在努力寻找一种在特定分支上运
Pandas - 查找并迭代多列中具有匹配值的行，并将另一列中的值相乘

这个问题是我的进一步的进步前一个 https stackoverflow com questions 51808294 pandas find rows with matching values in two columns and mul
使用elasticsearch匹配所有嵌套对象

有没有办法让elasticsearch只返回具有以下内容的文档all他们的嵌套对象符合某些标准吗假设我有以下人为的示例 mappings person
如何在 Mac OS X Mavericks 上链接 std C++ 库？

我正在将应用程序移植到 OS X Darwin 但遇到缺少符号的链接错误例如 std 1 basic string
像 iTunes 11 一样绘制 NSTableView 交替行

我知道还有其他关于更改交替行颜色的问题这很容易但这不是我想做的我想在基于视图的 NSTableView 中绘制自定义的交替颜色行这些行看起来像 iTunes 11 中的行行的顶部和底部有轻微的边框如此屏幕截图所示 NOTE 我知
在海报博客上，“液体错误：私有方法‘gsub’调用 nil:NilClass” 是什么意思？

我在博客右侧遇到了此消息的问题你能帮我一下吗我刚刚也遇到了这个错误您运行的液体过滤器的值可能为零我的 jekyll 网站上有这样的内容在我的根页面上未设置标题您可以通过确保设置该值来修复它或者您可以使用类似这样的方法来强制将
在 System.Windows.Form 派生类中的何处处置资源？

我有一个表单它在其构造函数中创建了一些我需要处理的一次性资源但是 C 表单设计器已在 Designer cs 文件中生成 Dispose 方法该方法中似乎没有任何类型的用户挂钩所以我不知道应该如何实现典型的IDisposable图案
获取丰富编辑库的版本

ALL 是否可以获得程序使用的 RichEdit 控件的版本 Version Class name Library Shipped with New features 1 0 RICHEDIT Riched32 dll Windows 95
鲁比：析构函数？

我偶尔需要在缓存目录中使用 rmagick 创建图像为了快速删除它们而又不会在视图中丢失它们我想在图像类的 Ruby 实例被破坏或进入垃圾收集时删除图像文件我必须重写什么 ClassMethod 才能为析构函数提供代码 edgeru
根据pandas数据框中的关键列减去列

我有两个数据框看起来像 df1 ID A B C D 0 ID1 0 5 2 1 3 5 6 6 1 ID2 1 2 5 5 4 3 2 2 2 ID1 0 7 1 2 5 6 6 0 3 ID3 1 1 7 2 10 3 2 df2 ID

根据pandas数据框中的关键列减去列

根据pandas数据框中的关键列减去列 的相关文章

随机推荐

热门标签

根据pandas数据框中的关键列减去列的相关文章