使用 pandas 将过滤器列表应用到来自列表的数据帧

2023-12-20

我有一个列列表，用于在来自列表的数据框中应用过滤器。过滤器值来自另一个列表。

早些时候，当列表固定时，我使用以下语句来完成工作：

df_result= df[(df[filterfieldList[0]] == filterValuesList[0]) & (df[filterfieldList[1]] == filterValuesList[1]) & (df[filterfieldList[2]] == filterValuesList[2])]

但随着时间的推移，我收到了一个新的要求，即过滤列表将是动态的，但我现在不知道如何做到这一点。有时，过滤器列表只有 2 个要过滤的字段，有时是 3 或 5 个。这种情况下如何进行过滤呢？

样本数据：

A             B            C                   D                 E
Project 1        Org_1     Directory        MSTR           Configuration    
Project 1        Org_1     Directory        MSTR          Unable to Login
Project 1       Org_1   Desktop Software    MSTR             Configuration
Project 1      Org_1    Desktop Software    MSTR           Configuration]
Project 1      Org_1    Directory           MSTR          Unable to Login

我认为需要列表理解来创建mask然后np.logical_and.reduce https://stackoverflow.com/q/20528328/2901002用于减少和最后过滤boolean indexing http://pandas.pydata.org/pandas-docs/stable/indexing.html#boolean-indexing:

filterfieldList = ['A','B','E']
filterValuesList = ['Project 1', 'Org_1', 'Unable to Login']

tups = zip(filterfieldList, filterValuesList)
df_result = df[np.logical_and.reduce([(df[i] == j) for i, j in tups])]
print (df_result)
           A      B          C     D                E
1  Project 1  Org_1  Directory  MSTR  Unable to Login
4  Project 1  Org_1  Directory  MSTR  Unable to Login

EDIT:

如果需要每行组合多个过滤器：

filterfieldList = ['A','B','E', 'E']
filterValuesList = ['Project 1', 'Org_1', 'Unable to Login', 'Configuration']

f = pd.DataFrame({'field': filterfieldList, 'val':filterValuesList})
f = f.groupby('field')['val'].apply(list)
print (f)
field
A                         [Project 1]
B                             [Org_1]
E    [Unable to Login, Configuration]
Name: val, dtype: object

df_result = df[np.logical_and.reduce([(df[i].isin(j)) for i, j in f.items()])]
print (df_result)
           A      B                 C     D                E
0  Project 1  Org_1         Directory  MSTR    Configuration
1  Project 1  Org_1         Directory  MSTR  Unable to Login
2  Project 1  Org_1  Desktop Software  MSTR    Configuration
4  Project 1  Org_1         Directory  MSTR  Unable to Login

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

list

pandas

DataFrame

filter

使用 pandas 将过滤器列表应用到来自列表的数据帧的相关文章

pandas DataFrame.join 的运行时间是多少（大“O”顺序）？

这个问题更具概念性理论性与非常大的数据集的运行时间有关所以我很抱歉没有一个最小的例子来展示我有一堆来自两个不同传感器的数据帧我需要最终将它们连接成两个very来自两个不同传感器的大数据帧 df snsr1 and df snsr2
多输出堆叠回归器

一次性问题我正在尝试构建一个多输入堆叠回归器添加到 sklearn 0 22 据我了解我必须结合StackingRegressor and MultiOutputRegressor 经过多次尝试这似乎是正确的顺序 import nu
使用主题交换运行多个 Celery 任务

我正在用 Celery 替换一些自制代码但很难复制当前的行为我期望的行为如下创建新用户时应向tasks与交换user created路由键该消息应该触发两个 Celery 任务即send user activate email
Haskell：从后面访问列表

今天我开始学习Haskell 我对函数式语言有点陌生而且我非常喜欢 Haskell 然而我有一个关于它的设计的问题困扰着我从我到目前为止的理解来看访问列表后面的元素似乎比访问前面的元素要复杂得多类似于xs x where xs a
Pycharm 在 os.path 连接上出现“未解析的引用”

将pycharm升级到2018 1 并将python升级到3 6 5后 pycharm报告未解析的引用 join 最新版本的 pycharm 不会显示以下行的任何警告 from os path import join expanduser
矩形函数的数值傅里叶变换

本文的目的是通过一个众所周知的分析傅里叶变换示例来正确理解 Python 或 Matlab 上的数值傅里叶变换为此我选择矩形函数这里报告了它的解析表达式及其傅立叶变换https en wikipedia org wiki Rectan
GUI（输入和输出矩阵）？

我需要创建一个 GUI 将数据输入到矩阵或表格中并读取此表单数据完美的解决方案是限制输入表单仅允许float 例如 A 1 02 0 25 0 30 0 515 0 41 1 13 0 15 1 555 0 25 0 14 1 21 2
在 DataFrame.withColumn 中，如何检查列的值是否为 null 作为第二个参数的条件？

如果我有一个名为 df 的 DataFrame 如下所示 a1 a2 foo bar N A baz null etc 我可以有选择地替换值如下所示 val df2 df withColumn a1 when a1 N A a2 这样 d
Java 和 Python 可以在同一个应用程序中共存吗？

我需要一个 Java 实例直接从 Python 实例数据存储中获取数据我不知道这是否可能数据存储是否透明唯一或者每个实例如果它们确实可以共存都有其单独的数据存储总结一下 Java 应用程序如何从 Python 应用程序的数据存
使用 python/numpy 重塑数组

我想重塑以下数组 gt gt gt test array 11 12 13 14 21 22 23 24 31 32 33 34 41 42 43 44 为了得到 gt gt gt test2 array 11 12 21 22 13 14
无法导入 langchain.agents.load_tools

我正在尝试使用 LangChain Agents 但无法导入 load tools 版本 langchain 0 0 27 我尝试过这些 from langchain agents import initialize agent from
尽管我已在 python ctypes 中设置了信号处理程序，但并未调用它

我尝试过使用 sigaction 和 ctypes 设置信号处理程序我知道它可以与python中的信号模块一起使用但我想尝试学习当我向该进程发送 SIGTERM 时但它没有调用我设置的处理程序只打印终止为什么它不调用处理程序
Python GTK+ 画布

我目前正在通过 PyGobject 学习 GTK 需要画布之类的东西我已经搜索了文档发现两个小部件似乎可以完成这项工作 GtkDrawingArea 和 GtkLayout 我需要一些基本函数如 fillrect 或 drawline
在 Google App Engine 中，如何避免创建具有相同属性的重复实体？

我正在尝试添加一个事务以避免创建具有相同属性的两个实体在我的应用程序中每次看到新的 Google 用户登录时我都会创建一个新的播放器当新的 Google 用户在几毫秒内进行多个 json 调用时我当前的实现偶尔会创建重复的播放器
制作一份 Python 文档的 PDF 文件

Python 官方网站提供 PDF 文档下载但它们是按章节分隔的我下载了源代码并构建了 PDF 文档这些文档也是单独的 PDF 我怎么能够从源代码中的 Makefile 构建一个 PDF 文件我认为这样阅读起来会更方便如果连接单独
等待子进程使用 os.system

我用了很多os system在 for 循环内调用创建后台进程如何等待所有后台进程结束 os wait告诉我没有子进程 ps 我使用的是Solaris 这是我的代码 usr bin python import subprocess imp
在virtualenv中下载sqlite3

我正在尝试使用命令创建应用程序python3 manage py startapp webapp但我收到一条错误消息 django core exceptions ImproperlyConfigured 加载时出错 pysqlite2 或
如何使用 PrimaryKeyRelatedField 更新多对多关系上的类别

Django Rest 框架有一个主键相关字段 http www django rest framework org api guide relations primarykeyrelatedfield其中列出了我的 IDmany to m
如何在 Flask 中的视图函数/会话之间传递复杂对象

我正在编写一个 Web 应用程序当且仅当用户登录时该应用程序从第三方服务器接收大量数据这些数据被解析为自定义对象并存储在list 现在用户在应用程序中使用这些数据调用不同的视图例如发送不同的请求我不确定什么是最好的模式在视
从列表中选择项目以求和

我有一个包含数值的项目列表我需要使用这些项目求和我需要你的帮助来构建这样的算法下面是一个用 C 编写的示例描述了我的问题 int sum 21 List

随机推荐

Node.js fs.readdir 递归目录搜索

关于使用 fs readdir 进行异步目录搜索有什么想法吗我意识到我们可以引入递归并使用下一个要读取的目录调用读取目录函数但我有点担心它不是异步的有任何想法吗我看过节点行走 https github com coolaj86 no
如何从 ArrayBuffer 在 WebGL 中渲染图像

我正在服务器端读取一张图像并通过 AJAX 调用推送到 Web 浏览器我有一个要求我必须使用 WebGL 逐行渲染它们例如图像为 640X480 其中 640 是宽度 480 是高度现在像素总数将为 640 480 307200
具有 2 个 SVN 服务器的相同代码工作副本 [重复]

这个问题在这里已经有答案了是否可以使用相同的工作副本并将其放入两个不同的 SVN 服务器提交更新如何同步两个 Subversion 存储库 https stackoverflow com questions 143130 how t
如何通过索引值和任意列中的值搜索pandas数据框

我正在尝试选择数据从文件中读入由值 1 和 0 表示我希望能够从值列表中选择行同时选择其中每个选定行的值为 1 的任何列为了使其更复杂我还想从值列表中选择行其中这些行的列中的所有值均为零这可能吗最终如果除 pandas
php将一个数字更改为另一个数字可以改回原来的数字

使用 PHP 我尝试将一个数字编码为另一个数字我可以将其解码回原始数字编码的字符串只需是数字不应包含其他任何内容例如 10 变成 573563547892 或类似的东西我怎样才能在 PHP 中做这样的事情我尝试了很多加密解密函数
在 Django 模板标签库中导入外部库时出错

因此我尝试编写一个 Django 可重用应用程序它提供了一种在页面上显示 Twitter feed 的方法我很清楚它已经存在了 20 次这是一项学术练习目录结构非常简单 myproject init py manage py se
加载 Apache Netbeans 9.0 或 10 时出现 Java 未找到错误

我下载了该程序的存档将其解压缩到 Windows 上的 C 盘然后当我尝试在其中运行任一可执行文件 32 位 64 位时bin文件夹我收到错误消息找不到 JAVA 1 8 或更高版本尽管已经安装了 Java 10 JRE 我也尝试
如何使用 React-Router 在 React 中正确渲染 404 页面？

我正在使用 React 和 React Router 构建一个网站我想在用户访问不存在的 url 时呈现 404 页面有些网址是动态的例如 www site com user username 如果具有特定用户名的用户不存在如何使用
特定文件的 mod_rewrite 异常

我的页面没有按应有的方式重定向因为我的 htaccess 文件设置为 RewriteEngine on RewriteCond 1 index php resources robots txt RewriteCond REQUEST FI
为什么 CaliberatedClassifierCV 的性能不如直接分类器？

我注意到 sklearn 是新的CalibratedClassifierCV似乎表现不如直接base estimator当的时候base estimator is GradientBoostingClassifer 我没有测试过其他分类器
如何使用正则表达式+替换将css样式的javascript字符串中的rgb值更改为十六进制值

我已经为此苦苦挣扎了一段时间所以我想我会在这里询问是否有人可以帮助我我在 javascript 中有一串 css 样式如下所示 width 250px background color rgb 48 44 48 我试图通过一个名为 R
如何在 JavaScript 数组中分组、计算总和并获取平均值？

我有对象数组 const users group editor name Adam age 23 group admin name John age 28 group editor name William age 34 group adm
当 b 大于 a 中的位数时，右移 (a >> b) 的未定义行为？

显然右移操作的行为 a gt gt b 在 C 和 C 中未定义b gt sizeof a CHAR BIT 而在正常情况下由于右移而从左侧引入的新位等于零为什么这种未定义的行为比将结果设置为零更好b gt sizeof a CH
从 IEnumerable 中过滤重复项

我有这个代码 class MyObj int Id string Name string Location IEnumerable
Puppeteer 找不到选择器

我正在尝试使用 Puppeteer 进行一些网页抓取但脚本似乎无法找到我正在寻找的选择器基本上这段代码 const puppeteer require puppeteer let scrape async gt const year 1
根据条件分割 JavaScript 字符串

我可以在 JavaScript 中使用 split 来用逗号分隔字符串我的字符串如下 Hojas DNI Factura Con N de O C impresa otra cosa Pasaporte Permiso 结果应该是 Ho
如何将 dropshadoweffect 添加到文本框的文本（以编程方式）

我有一个在某个时刻以编程方式添加到画布的文本框我希望所有文本都具有投影效果但我不希望将该效果应用于文本框本身的边框我该怎么做呢向文本框添加 dropshadoweffect 会将效果应用到框的边框并稍微模糊文本但这不是我想要
找出 XLL 自定义工作表函数被调用的名称

可以使用以下命令多次将相同的 XLL 函数注册为自定义工作表函数xlfRegister 当调用XLL函数时有什么方法可以找出工作表中使用哪个名称来调用该函数除了解析Excel公式这可能不是很可靠 Malick 的答案可以为您提供当前函
具有类型 nat 的向量的应用实例

我目前正在与善良的人玩耍并在尝试定义矢量数据类型的应用实例时陷入困境我认为一个合理的例子是pure 1 Vec 3 Int会给我一个长度为 3 的向量所有元素均为值 1 和 lt gt 运算符将函数与值压缩在一起我陷入困境的问题是它
使用 pandas 将过滤器列表应用到来自列表的数据帧

我有一个列列表用于在来自列表的数据框中应用过滤器过滤器值来自另一个列表早些时候当列表固定时我使用以下语句来完成工作 df result df df filterfieldList 0 filterValuesList 0 df f

使用 pandas 将过滤器列表应用到来自列表的数据帧

使用 pandas 将过滤器列表应用到来自列表的数据帧 的相关文章

随机推荐

热门标签

使用 pandas 将过滤器列表应用到来自列表的数据帧的相关文章