如何计算根据条件选择的一组行中的元素数量?

2024-01-03

我有一个大DataFrame有许多重复值。唯一值存储在List1。我想做以下事情:

  1. 选择包含列表中存在的每个值的几行。
  2. 迭代选定的行并计算非 NaN 元素的数量
  3. 如果计数值大于或等于2,则将其存储到新列表中。中的每个组件List1应添加到eq_list除非all“eq”的计数值 >=2。

简化的示例输入:

List1 = ['A','B','C','D','E','F','G','H','X','Y','Z']

Sample DF 'ABC':

        EQ1  EQ2   EQ3
0       A    NaN   NaN
1       X    Y     NaN
2       A    X     C
3       D    E     F
4       G    H     B

期望的输出:

eq_list = ['B','C','D','E','F','G','H','X','Y']

我尝试过的小代码:

for eq in List1:
    MCS=ABC.loc[MCS_old[:] ==eq]
    MCS = MCS.reset_index(drop=True)
    for index_new in range(0,len(MCS)-1):
        if int(MCS.iloc[[index_new]].count(axis=1))>2:
            eq_list.append(raw_input(eq))
            print(eq_list)

我希望我已经把这个问题说清楚了。


假设您有:

df
    EQ1 EQ2 EQ3
0   A   NaN NaN
1   X   Y   NaN
2   A   X   C
3   D   E   F
4   G   H   B

然后,您可以按照以下步骤进行:

dft = df.T
output_set = set()
prune_set =  set()
for column in dft:
    arr = dft[column].dropna().values
    if len(arr) >=2:
        output_set |= set(arr)
    else:
        prune_set |= set(arr)
sorted(output_set - prune_set)
['B', 'C', 'D', 'E', 'F', 'G', 'H', 'X', 'Y']
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何计算根据条件选择的一组行中的元素数量? 的相关文章

  • OpenCV Python cv2.mixChannels()

    我试图将其从 C 转换为 Python 但它给出了不同的色调结果 In C Transform it to HSV cvtColor src hsv CV BGR2HSV Use only the Hue value hue create
  • Django:按钮链接

    我是一名 Django 新手用户 尝试创建一个按钮 单击该按钮会链接到我网站中的另一个页面 我尝试了一些不同的例子 但似乎没有一个对我有用 举个例子 为什么这不起作用
  • 使用 matplotlib 绘制时间序列数据并仅在年初显示年份

    rcParams date autoformatter month b n Y 我正在使用 matpltolib 来绘制时间序列 如果我按上述方式设置 rcParams 则生成的图会在每个刻度处标记月份名称和年份 我怎样才能将其设置为仅在每
  • 绘制随时间变化的分类数据计数

    我有一个数据框 df 其中有一列包含分类数据 ETH 带有 DateTimeIndex 我想绘制类别counts随着时间的推移 它们按天索引 我最好按年绘制它们 df pd DataFrame County 0 Bexar 3 Nueces
  • 是否可以忽略一行的pyright检查?

    我需要忽略一行的pyright 检查 有什么特别的评论吗 def create slog group SLogGroup data Optional dict None SLog insert one SLog group group da
  • ipython/ pylab/ matplotlib安装和初始化错误

    我在 OS X El Captain 上安装了 matplotlib anaconda ipython 然而 即使在尝试以所有可能的方式设置环境变量之后 我仍无法启动 ipython shell pylab 版本 这是错误 ImportEr
  • 如何使用 OpencV 从 Firebase 读取图像?

    有没有使用 OpenCV 从 Firebase 读取图像的想法 或者我必须先下载图片 然后从本地文件夹执行 cv imread 功能 有什么办法我可以使用cv imread link of picture from firebase 您可以
  • 绘制方程

    我正在尝试创建一个函数 它将绘制我告诉它的任何公式 import numpy as np import matplotlib pyplot as plt def graph formula x range x np array x rang
  • 如何使用Python创建历史时间线

    So I ve seen a few answers on here that helped a bit but my dataset is larger than the ones that have been answered prev
  • Pygame:有没有简单的方法可以找到按下的任何字母数字的字母/数字?

    我目前正在开发的游戏需要让人们以自己的名义在高分板上计时 我对如何处理按键有点熟悉 但我只处理过寻找特定的按键 有没有一种简单的方法可以按下任意键的字母 而不必执行以下操作 for event in pygame event get if
  • python获取上传/下载速度

    我想在我的计算机上监控上传和下载速度 一个名为 conky 的程序已经在 conky conf 中执行了以下操作 Connection quality alignr wireless link qual perc wlan0 downspe
  • 无法在 Python 3 中导入 cProfile

    我试图将 cProfile 模块导入 Python 3 3 0 但出现以下错误 Traceback most recent call last File
  • Jupyter Notebook 内核一直很忙

    我已经安装了 anaconda 并且 python 在 Spyder IPython 等中工作正常 但是我无法运行 python 笔记本 内核被创建 它也连接 但它始终显示黑圈忙碌符号 防火墙或防病毒软件没有问题 我尝试过禁用两者 我也无法
  • 如何在seaborn displot中使用hist_kws

    我想在同一图中用不同的颜色绘制直方图和 kde 线 我想为直方图设置绿色 为 kde 线设置蓝色 我设法弄清楚使用 line kws 来更改 kde 线条颜色 但 hist kws 不适用于显示 我尝试过使用 histplot 但我无法为
  • 每个 X 具有多个 Y 值的 Python 散点图

    我正在尝试使用 Python 创建一个散点图 其中包含两个 X 类别 cat1 cat2 每个类别都有多个 Y 值 如果每个 X 值的 Y 值的数量相同 我可以使用以下代码使其工作 import numpy as np import mat
  • Python:如何将列表列表的元素转换为无向图?

    我有一个程序 可以检索 PubMed 出版物列表 并希望构建一个共同作者图 这意味着对于每篇文章 我想将每个作者 如果尚未存在 添加为顶点 并添加无向边 或增加每个合著者之间的权重 我设法编写了第一个程序 该程序检索每个出版物的作者列表 并
  • 发送用户注册密码,django-allauth

    我在 django 应用程序上使用 django alluth 进行身份验证 注册 我需要创建一个自定义注册表单 其中只有一个字段 电子邮件 密码将在服务器上生成 这是我创建的表格 from django import forms from
  • 使用 Python 的 matplotlib 选择在屏幕上显示哪些图形以及将哪些图形保存到文件中

    我想用Python创建不同的图形matplotlib pyplot 然后 我想将其中一些保存到文件中 而另一些则应使用show 命令 然而 show 显示all创建的数字 我可以通过调用来避免这种情况close 创建我不想在屏幕上显示的绘图
  • 如何将输入读取为数字?

    这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章 目前不接受新的答案或互动 Why are x and y下面的代码中使用字符串而不是整数 注意 在Python 2
  • Statsmodels.formula.api OLS不显示截距的统计值

    我正在运行以下源代码 import statsmodels formula api as sm Add one column of ones for the intercept term X np append arr np ones 50

随机推荐

  • 选择不同的通知并准备更清晰的通知消息

    我已经创建了一个通知系统 它非常好 为了使其完美 还有一些事情需要改进 所以我就在这里 我正在开发的应用程序是一个用 PHP 编写的网站 我的通知有这个seen指示通知是否已签出的列 当用户单击与 Facebook 非常相似的通知下拉按钮时
  • 如何导入资源模块?

    今天我看到一个 python 文件以 import sys import time import heapq import resource from itertools import groupby from collections im
  • Heroku Rails Procfile

    我对 Heroku 很陌生 我将 Rails 应用程序上传到 Heroku 并希望使用 Thin 而不是 Webrick 来运行它 下列的Heroku 的指南 https devcenter heroku com articles rail
  • 带有 Flex SDK 的 Flash 组件

    我正在使用 Flex SDK 将 ActionScript 3 类编译为 swf 有些组件未包含在 SDK 中 例如 fl controls 组件 我有哪些选项可以访问闪存组件 我看到其他人提到我可以将它们导出到 Flash Pro 中的
  • Lua:加载文件后获取全局函数失败

    我正在尝试调用名为 test2 lua 的 lua 文件内的函数 这是test2 lua的内容 function abc path t table insert t a return t end 正如您所看到的 它需要一个输入并返回一个字符
  • Android:读取在 Google Drive 文件选择器中选择的文件

    在我的应用程序中 我需要读取一个设置文件 该设置文件可以位于本地存储中 也可以位于用户的 Google Drive 存储中 安装了 Google Drive 应用程序 下面打开一个文件选择器 首先询问用户要使用哪个文件选择器 包括使用 Go
  • 如何检索一个人的所有 GitHub 存储库列表?

    我们需要显示一个人在 GitHub 帐户上的存储库中的所有项目 如何使用特定人员的 git 用户名显示其所有 git 存储库的名称 您可以使用github API http developer github com v3 repos 为了这
  • 第二次加载谷歌地图片段时,膨胀视图上的空指针

    我正在使用 DrawerLayout 当我第二次加载谷歌地图片段时 异常将按预期被捕获 但是 当我尝试时 进一步采用相同的方法 Button btnShowList Button ui findViewById R id btnShowLi
  • 这是全局范围内的严格模式(在 ES2015 中)

    有人可以指出 ES2015 标准中说明什么的地方吗 this在全局范围内以严格模式使用时必须引用 我发现它等于window在我的 firefox 和 chrome 中 但不等于window在我的 Windows 7 x64 下的 IE11
  • 为什么钥匙串比保存在文件中的加密数据更安全?

    为什么钥匙串比 iOS 应用程序文档目录中保存为文件的加密数据更安全 通常 数据使用对称加密算法 例如 AES 进行加密 并且加密密钥保存在钥匙串中 数据可以放置在任何文件位置 通过加密算法和密钥进行保护 钥匙串存储加密的密钥 和其他小数据
  • 将 SOLR 查询转换为 ElasticSearch URI 格式

    我已将 SOLR 核心文档移至 ElasticSearch 索引 现在我需要将 SOLR 查询参数转换为 ES 格式 我在这里看过ES文档https www elastic co guide en elasticsearch referen
  • 如何列出 Rails 中的所有自动加载路径

    如何列出 Rails 中的所有自动加载路径 在 Rails 控制台中 当我执行此操作时 它仅列出添加到配置中的自定义路径 rails c Loading development environment Rails 3 2 9 1 9 3p1
  • 如何将 Google 安全浏览 (v4) 与 .NET 结合使用

    我正在尝试使用 Google 的安全浏览查找 API v4 https developers google com safe browsing v4 lookup api https developers google com safe b
  • =* sql 中的运算符

    我正在打字 手指很粗 当我打字时 在 sql 窗口中 2008 SSMS 连接到 2005 服务器 它作为关键字变成蓝色 我无法弄清楚 或者谷歌 这是做什么的 我知道 但不知道 这个操作员是做什么的 是一种编写右外连接的旧方法 例如 sel
  • NodeJS 中不同路径的并行请求:长时间运行的路径 1 阻塞其他路径

    我正在尝试简单的 NodeJS 应用程序 以便我能够理解异步本质 但我的问题是 一旦我点击 home 从浏览器等待响应 同时 被击中 它等待 home先回复 再回复 要求 我担心的是 如果其中一个请求需要大量处理 那么我们不能同时请求另一个
  • 有没有办法否定 .dockerignore 中的模式?

    我试图否定 dockerignore 中的模式 Globbing 是使用 Go 的 filepath Match 规则完成的 检查后source http golang org src pkg path filepath match go
  • Javafx 8:在初始化方法中填充 TableView

    我是 JavaFX 8 的新手 我正在尝试使用初始化方法向 TableView 提供控制器中的一些数据 我看过很多关于它的话题 尝试了很多东西 但它对我不起作用 我见过 如何使用 FXML 和 JavaFX 动态填充 TableView h
  • Angular 2 - 如何显示多选下拉列表的选定选项?

  • Team Build 2012 是否与 Team Foundation Server 2010 兼容?

    连接是一种什么体验团队建设 http en wikipedia org wiki Team Foundation Server Team Build2012年至团队基础服务器 http en wikipedia org wiki Team
  • 如何计算根据条件选择的一组行中的元素数量?

    我有一个大DataFrame有许多重复值 唯一值存储在List1 我想做以下事情 选择包含列表中存在的每个值的几行 迭代选定的行并计算非 NaN 元素的数量 如果计数值大于或等于2 则将其存储到新列表中 中的每个组件List1应添加到eq