如何通过将列的类别分成集合来过滤数据框？

2023-12-09

我有一个数据框：

Prop_ID    Unit_ID      Prop_Usage                     Unit_Usage
1          1            RESIDENTIAL                    RESIDENTIAL
1          2            RESIDENTIAL                    COMMERCIAL
1          3            RESIDENTIAL                    INDUSTRIAL
1          4            RESIDENTIAL                    RESIDENTIAL
2          1            COMMERCIAL                     RESIDENTIAL
2          2            COMMERCIAL                     COMMERCIAL
2          3            COMMERCIAL                     COMMERCIAL
3          1            INDUSTRIAL                     INDUSTRIAL
3          2            INDUSTRIAL                     COMMERCIAL
4          1            RESIDENTIAL - COMMERCIAL       RESIDENTIAL
4          2            RESIDENTIAL - COMMERCIAL       COMMERCIAL
4          3            RESIDENTIAL - COMMERCIAL       INDUSTRIAL
5          1            COMMERCIAL / RESIDENTIAL       RESIDENTIAL
5          2            COMMERCIAL / RESIDENTIAL       COMMERCIAL
5          3            COMMERCIAL / RESIDENTIAL       INDUSTRIAL
5          4            COMMERCIAL / RESIDENTIAL       COMMERCIAL

一处房产可能有超过 1 个单元。这意味着单位是属性的子类别。我想过滤行Prop_Usage不匹配Unit_Usage。我们有一个类别Prop_Usage列就是RESIDENTIAL - COMMERCIAL then Unit_Usage可以是RESIDENTIAL or COMMERCIAL。同样对于COMMERCIAL / RESIDENTIAL.

预期输出：

Prop_ID    Unit_ID      Prop_Usage                   Unit_Usage
1          2            RESIDENTIAL                  COMMERCIAL
1          3            RESIDENTIAL                  INDUSTRIAL
2          1            COMMERCIAL                   RESIDENTIAL
3          2            INDUSTRIAL                   COMMERCIAL
4          3            RESIDENTIAL - COMMERCIAL     INDUSTRIAL
5          3            COMMERCIAL / RESIDENTIAL     INDUSTRIAL

Use in中的声明DataFrame.apply:

df = df[~df.apply(lambda x: x['Unit_Usage'] in x['Prop_Usage'], axis=1)]

Or use zip在列表理解中：

df = df[[not a in b for a, b in zip(df['Unit_Usage'], df['Prop_Usage'])]]

print (df)
    Prop_ID  Unit_ID                Prop_Usage   Unit_Usage
1         1        2               RESIDENTIAL   COMMERCIAL
2         1        3               RESIDENTIAL   INDUSTRIAL
4         2        1                COMMERCIAL  RESIDENTIAL
8         3        2                INDUSTRIAL   COMMERCIAL
11        4        3  RESIDENTIAL - COMMERCIAL   INDUSTRIAL
14        5        3  COMMERCIAL / RESIDENTIAL   INDUSTRIAL

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

pandasgroupby

如何通过将列的类别分成集合来过滤数据框？的相关文章

如何在 Sublime Text 2 的 OSX 终端中显示构建结果

我刚刚从 TextMate 切换到 Sublime Text 2 我非常喜欢它让我困扰的一件事是默认的构建结果显示在 ST2 的底部我的程序产生一些很长的结果显示它的理想方式如在 TM2 中是并排查看它们如何在 Mac 操作系统
R 中的列乘以子字符串

假设我有一个数据框其中包含多个组件及其在多个列中列出的属性并且我想对这些列运行多个函数我的方法是尝试将其基于每个列标题中的子字符串但我无法弄清楚如何做到这一点下面是数据框的示例 Basket F Type 1 F Qty 1 F
SQL Alchemy 中的 NULL 安全不等式比较？

目前我知道如何表达 NULL 安全的唯一方法 SQL Alchemy 中的比较其中与 NULL 条目的比较计算结果为 True 而不是 NULL 是 or field None field value 有没有办法在 SQL Alchem
如何使用 Scrapy 从网站获取所有纯文本？

我希望在 HTML 呈现后可以从网站上看到所有文本我正在使用 Scrapy 框架使用 Python 工作和xpath body text 我能够获取它但是带有 HTML 标签而且我只想要文本有什么解决办法吗最简单的选择是ext
从 scikit-learn 导入 make_blobs [重复]

这个问题在这里已经有答案了我收到下一个警告 D Programming Python ML venv lib site packages sklearn utils deprecation py 77 DeprecationWarning
在循环中每次迭代开始时将变量重新分配给原始值（在循环之前定义）

在Python中你使用在每次迭代开始时将变量重新分配给原始值在循环之前定义时也就是说 original 1D o o o for i in range 0 3 new original 1D revert back to orig
从列表中的数据框列中搜索部分字符串匹配 - Pandas - Python

我有一个清单 things A1 B2 C3 我有一个 pandas 数据框其中有一列包含用分号分隔的值某些行将包含与上面列表中的一项的匹配它不会是完美的匹配因为它在其中包含字符串的其他部分该列例如该列中的一行可能有哇这里
使用 Pycharm 在 Windows 下启动应用程序时出现 UnicodeDecodeError

问题是当我尝试启动应用程序 app py 时我收到以下错误 UnicodeDecodeError utf 8 编解码器无法解码位置 5 中的字节 0xb3 起始字节无效整个文件app py coding utf 8 from flask
python 集合可以包含的值的数量是否有限制？

我正在尝试使用 python 设置作为 mysql 表中 ids 的过滤器 python集存储了所有要过滤的id 现在大约有30000个这个数字会随着时间的推移慢慢增长我担心python集的最大容量它可以包含的元素数量有限制吗您最大
Pandas Dataframe 中 bool 值的条件前向填充

问题如何转发 fill boolTruepandas 数据框中的值如果是当天的第一个条目 True 到一天结束时请参阅以下示例和所需的输出 Data import pandas as pd import numpy as np df
表达式中的 Python 'in' 关键字与 for 循环中的比较 [重复]

这个问题在这里已经有答案了我明白什么是in运算符在此代码中执行的操作 some list 1 2 3 4 5 print 2 in some list 我也明白i将采用此代码中列表的每个值 for i in 1 2 3 4 5 print
Python - 在窗口最小化或隐藏时使用 pywinauto 控制窗口

我正在尝试做的事情我正在尝试使用 pywinauto 在 python 中创建一个脚本以在后台自动安装 notepad 隐藏或最小化 notepad 只是一个示例因为我将编辑它以与其他软件一起使用 Problem 问题是我想在安装程序
Python 3 中“map”类型的对象没有 len()

我在使用 Python 3 时遇到问题我得到了 Python 2 7 代码目前我正在尝试更新它我收到错误类型错误 map 类型的对象没有 len 在这部分 str len seed candidates 在我像这样初始化它之前 se
从 pygame 获取 numpy 数组

我想通过 python 访问我的网络摄像头不幸的是由于网络摄像头的原因 openCV 无法工作 Pygame camera 使用以下代码就像魅力一样 from pygame import camera display camera in
设置 torch.gather(...) 调用的结果

我有一个形状为 n x m 的 2D pytorch 张量我想使用索引列表来索引第二个维度可以使用 torch gather 完成然后然后还设置新值到索引的结果 Example data torch tensor 0 1 2 3 4
如何从没有结尾的管道中读取 python 中的 stdin

当管道来自打开时不知道正确的名称我无法从 python 中的标准输入或管道读取数据文件我有作为例子管道测试 py import sys import time k 0 try for line in sys stdin k k
使用基于正则表达式的部分匹配来选择 Pandas 数据帧的子数据帧

我有一个 Pandas 数据框它有两列一列进程参数列包含字符串另一列值列包含相应的浮点值我需要过滤出部分匹配列过程参数中的一组键的子数据帧并提取与这些键匹配的数据帧的两列 df pd DataFrame Proce
您可以在 Python 类型注释中指定方差吗？

你能发现下面代码中的错误吗米皮不能 from typing import Dict Any def add items d Dict str Any gt None d foo 5 d Dict str str add items d f
Spark.read 在 Databricks 中给出 KrbException

我正在尝试从 databricks 笔记本连接到 SQL 数据库以下是我的代码 jdbcDF spark read format com microsoft sqlserver jdbc spark option url jdbc sql
PyAudio ErrNo 输入溢出 -9981

我遇到了与用户相同的错误 Python 使用 Pyaudio 以 16000Hz 录制音频时出错 https stackoverflow com questions 12994981 python error audio recording

随机推荐

允许 ics 在 iOS 的 PhoneGap 应用程序中打开

所以我使用了这段代码here稍微增强一下可以在 iOS 上动态创建 ics 文件 msgData1 start time text msgData2 end time text msgData3 Location text var ics
如何在 SQL select 语句中动态创建列

我有3张桌子团队选项选项团队团队拥有 TeamId 和 NameOption保存OptionId OptionGroupOptionTeam持有TeamId OptionId OptionGroup select a TeamId
终止/暂停时位置 API 发生重大变化的行为？

这是来自CL位置管理器描述应用程序行为的文档开始监控重大位置变化如果您启动此服务并且您的随后申请系统自动终止重新启动应用程序到如果有新事件到来则背景在在这种情况下选项字典传递给应用程序 didFinishLaunchi
我想检测 winforms 列表框控件中双击的项目。 [如何处理点击空白区域？]

好吧我有一个列表框里面有一些项目我想检测对某个项目的双击目前我使用的方法有一个问题如果用户双击空白处当前选定的项目将被标记为双击 Update 请注意这个问题并不像乍看起来那么简单另请注意 Timwi 答案不正确因为如果选
使用按位移位反转数字

我正在尝试找到一种方法来反转数字without 将其转换为字符串以求长度反转字符串并解析回来运行单独的循环来计算长度我目前正在这样做 public static int getReverse int num int revnum 0
为什么 longLongValue 返回错误的值

我有一个 NSDictionary 其中包含一个值为 4937446359977427944 的键我尝试将其值获取为 long long 并返回 4937446359977427968 NSLog value1 dict objectFo
Angular xlsx - 多个 json 到工作表

我使用 js xlsx 和函数 utils json to sheet 导出到 Excel 问题是我有另一个 json 对象我想将其导出到同一张表位于前一个表的正下方 XLSX utils json to sheet outputDat
为什么 Html5 音频在文件加载时从服务器加载所有歌曲

我的本地 Web 应用程序使用 java Spark 框架创建了一个 Html5 报告其中一些页面包含可以播放的音频文件最初这纯粹是通过 Html 完成的例如
Java：在 Ubuntu 上请求 root 权限

如何调用身份验证窗口从类中为当前应用程序授予 root 一段时间的访问权限例如我正在编写一些应用程序来处理分区因此它需要 root 权限才能执行某些操作也许你无法用 Java 做到这一点最好的方法是也许你可以检测到该程序没有运
每天在特定时间运行 DAG

我读过多个例子schedule interval start dateAirflow 文档也多次出现但我仍然无法理解我如何在每天的特定时间执行我的 DAG 例如现在是 9 30 上午我部署 DAG 并且希望它在 10 30 执行我
在使用 std::array 的类的构造函数中初始化 std::array 的大小

是否可以使用std array
致命错误：调用未定义的函数 ftp_ssl_connect()

我正在尝试在 PHP 中设置 FTP SSL 连接我用过ftp connect 很好效果很好一旦我尝试使用ftp ssl connect 我收到此错误致命错误调用未定义的函数 ftp ssl connect 我确实在 PHP 扩展
具有动态列的 LINQ Pivot

我正在尝试使用带有动态列的 LINQ 创建数据透视表我在 SQL Server 中创建了一个数据透视表您不知道将使用哪些列但不知道如何将其转移到 LINQ 中有人有链接供我开始使用吗 Cheers List
使用 python 提取 pdf 表格中包含的文本的最佳方法是什么？

我正在构建一个程序从 pdf 中提取文本将其放入结构化格式然后将其发送到数据库我有大约 1 400 个单独的 pdf 文件它们都遵循类似的格式但文档总结的措辞和计划设计中的细微差别使其变得棘手我在 python 中尝试过几个不
我什么时候应该关闭DatabaseHelper？

参考this链接如果只有一个连接什么时候是关闭连接的好时机我有一项服务始终在后台运行什么时候是打电话的好时机close 功能有什么建议么你实际上不必打电话close 例如如果您实现内容提供商则没有机会调用close 我们被告
禁用表单提交，直到选中（两个）复选框

我们有一个表单在提交表单之前我们有两个复选框 privacy 条款和条件我想做的是在验证复选框时遇到问题禁用提交按钮直到选中两个复选框为止这些的 html 是
NumPy for windows python 2.7 [关闭]

很难说出这里问的是什么这个问题模棱两可含糊不清不完整过于宽泛或言辞激烈无法以目前的形式合理回答如需帮助澄清此问题以便重新打开访问帮助中心我找不到适用于 windows python 2 7 的 NumPy 尽管我找到了它的
将区域设置设置为系统默认 UTF-8

当在 rApache 中运行 R 时语言环境是从 Apache Web 服务器继承的因此Sys getlocale 总是等于 C 我希望使用我的网络应用程序UTF8 所以我使用 Sys setlocale LC ALL en US UT
do 块中的返回类型

我试图理解 Haskell 中的 Monad 在我无数次的代码实验中我遇到了这个事情 f2 do return da 事实上它不想在编译时出现关于类型的巨大错误我认为唯一重要的部分是 No instance for Monad m0 a
如何通过将列的类别分成集合来过滤数据框？

我有一个数据框 Prop ID Unit ID Prop Usage Unit Usage 1 1 RESIDENTIAL RESIDENTIAL 1 2 RESIDENTIAL COMMERCIAL 1 3 RESIDENTIAL IND

如何通过将列的类别分成集合来过滤数据框？

如何通过将列的类别分成集合来过滤数据框？ 的相关文章

随机推荐

热门标签

如何通过将列的类别分成集合来过滤数据框？的相关文章