如何查询pandas中的MultiIndex索引列值

2023-11-24

代码示例：

In [171]: A = np.array([1.1, 1.1, 3.3, 3.3, 5.5, 6.6])

In [172]: B = np.array([111, 222, 222, 333, 333, 777])

In [173]: C = randint(10, 99, 6)

In [174]: df = pd.DataFrame(zip(A, B, C), columns=['A', 'B', 'C'])

In [175]: df.set_index(['A', 'B'], inplace=True)

In [176]: df
Out[176]: 
          C
A   B      
1.1 111  20
    222  31
3.3 222  24
    333  65
5.5 333  22
6.6 777  74

现在，我想检索 A 值：
Q1：在 [3.3, 6.6] 范围内 - 预期返回值：[3.3, 5.5, 6.6] 或 [3.3, 3.3, 5.5, 6.6]（如果包含最后一个），以及 [3.3, 5.5] 或 [3.3, 3.3, 5.5] 如果不是。
Q2：范围 [2.0, 4.0] - 预期返回值：[3.3] 或 [3.3, 3.3]

对于任何其他的都一样多重索引尺寸，例如 B 值：
Q3：在范围 [111, 500] 内重复，作为范围内的数据行数 - 预期返回值：[111, 222, 222, 333, 333]

更正式：

假设 T 是一个包含 A、B 和 C 列的表。该表包括n行。表格单元格是数字，例如 A 双精度型、B 和 C 整数。让我们创建一个数据框表 T 的数据，我们将其命名为 DF。让我们设置 DF 的 A 列和 B 列索引（不重复，即没有单独的 A 列和 B 列作为索引，并且单独作为数据），即本例中的 A 和 B多重索引.

问题：

如何在索引上编写查询，例如查询索引 A（或 B），例如在标签区间 [120.0, 540.0] 中？存在标签 120.0 和 540.0。我必须澄清，我只对作为查询响应的索引列表感兴趣！
如何相同，但如果标签 120.0 和 540.0 不存在，但存在值低于 120、高于 120 且低于 540 或高于 540 的标签？
如果 Q1 和 Q2 的答案是唯一索引值，现在相同，但有重复，作为索引范围内的数据行数。

我知道在不是索引的列的情况下上述问题的答案，但在索引的情况下，经过在网络上的长期研究和对以下功能的实验pandas，我没有成功。我现在看到的唯一方法（无需额外编程）是除了索引之外还有 A 和 B 的副本作为数据列。

要查询df by the 多重索引值，例如，其中(A > 1.7) 和 (B :

In [536]: result_df = df.loc[(df.index.get_level_values('A') > 1.7) & (df.index.get_level_values('B') < 666)]

In [537]: result_df
Out[537]: 
          C
A   B      
3.3 222  43
    333  59
5.5 333  56

因此，例如要得到'A'索引值（如果仍需要）：

In [538]: result_df.index.get_level_values('A')
Out[538]: Index([3.3, 3.3, 5.5], dtype=object)

问题是，在大数据帧中，by index选择比排序的常规行选择差 10%。并且在重复性工作、循环中，延迟不断累积。参见示例：

In [558]: df = store.select(STORE_EXTENT_BURSTS_DF_KEY)

In [559]: len(df)
Out[559]: 12857

In [560]: df.sort(inplace=True)

In [561]: df_without_index = df.reset_index()

In [562]: %timeit df.loc[(df.index.get_level_values('END_TIME') > 358200) & (df.index.get_level_values('START_TIME') < 361680)]
1000 loops, best of 3: 562 µs per loop

In [563]: %timeit df_without_index[(df_without_index.END_TIME > 358200) & (df_without_index.START_TIME < 361680)]
1000 loops, best of 3: 507 µs per loop

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何查询pandas中的MultiIndex索引列值的相关文章

将 Matplotlib 误差线放置在不位于条形中心的位置

我正在 Matplotlib 中生成带有错误栏的堆积条形图不幸的是某些层相对较小且数据多样因此多个层的错误条可能重叠从而使它们难以或无法读取 Example 有没有办法设置每个误差条的位置即沿 x 轴移动它以便重叠的线显示在彼此
Python（Selenium）：如何通过登录重定向/组织登录登录网站

我不是专业程序员所以请原谅任何愚蠢的错误我正在做一些研究我正在尝试使用 Selenium 登录数据库来搜索大约 1000 个术语我有两个问题 1 重定向到组织登录页面后如何使用 Selenium 登录 2 如何检索数据库在我解决
通过最小元素比较对 5 个元素进行排序

我必须在 python 中使用元素之间的最小比较次数来建模对 5 个元素的列表进行排序的执行计划除此之外复杂性是无关紧要的结果是一个对的列表表示在另一时间对列表进行排序所需的比较我知道有一种算法可以通过 7 次比较总是在元素之间
Django：按钮链接

我是一名 Django 新手用户尝试创建一个按钮单击该按钮会链接到我网站中的另一个页面我尝试了一些不同的例子但似乎没有一个对我有用举个例子为什么这不起作用
如何使用 Ansible playbook 中的 service_facts 模块检查服务是否存在且未安装在服务器中？

我用过service facts检查服务是否正在运行并启用在某些服务器中未安装特定的软件包现在我如何知道这个特定的软件包没有安装在该特定的服务器上service facts module 在 Ansible 剧本中它显示以下错误
使用 on_bad_lines 将 pandas.read_csv 中的无效行写入文件

我有一个 CSV 文件我正在使用 Python 来解析该文件我发现文件中的某些行具有不同的列数 001 Snow Jon 19801201 002 Crom Jake 19920103 003 Wise Frank 19880303 l
python 相当于 R 中的 get() （= 使用字符串检索符号的值）

在 R 中 get s 函数检索名称存储在字符变量向量中的符号的值s e g X lt 10 r lt XVI s lt substr r 1 1 X get s 10 取罗马数字的第一个符号r并将其转换为其等效整数尽管花了一些时间翻
以编程方式停止Python脚本的执行？ [复制]

这个问题在这里已经有答案了是否可以使用命令在任意行停止执行 python 脚本 Like some code quit quit at this point some more code that s not executed sys e
从 Flask 访问 Heroku 变量

我已经使用以下命令在 Heroku 配置中设置了数据库变量 heroku config add server xxx xxx xxx xxx heroku config add user userName heroku config add
添加不同形状的 numpy 数组

我想添加两个不同形状的 numpy 数组但不进行广播而是将缺失值视为零可能最简单的例子是 1 2 3 2 gt 3 2 3 or 1 2 3 2 1 gt 3 2 3 1 0 0 我事先不知道形状我正在弄乱每个 np shape
在f字符串中转义字符[重复]

这个问题在这里已经有答案了我遇到了以下问题f string gt gt gt a hello how to print hello gt gt gt f a a gt gt gt f a File
Fabric env.roledefs 未按预期运行

On the 面料网站 http docs fabfile org en 1 10 usage execution html 给出这个例子 from fabric api import env env roledefs web hosts
将图像分割成多个网格

我使用下面的代码将图像分割成网格的 20 个相等的部分 import cv2 im cv2 imread apple jpg im cv2 resize im 1000 500 imgwidth im shape 0 imgheight i
每个 X 具有多个 Y 值的 Python 散点图

我正在尝试使用 Python 创建一个散点图其中包含两个 X 类别 cat1 cat2 每个类别都有多个 Y 值如果每个 X 值的 Y 值的数量相同我可以使用以下代码使其工作 import numpy as np import mat
如何在 Python 中追加到 JSON 文件？

我有一个 JSON 文件其中包含 67790 1 kwh 319 4 现在我创建一个字典a dict我需要将其附加到 JSON 文件中我尝试了这段代码 with open DATA FILENAME a as f json obj js
解释 Python 中的数字范围

在 Pylons Web 应用程序中我需要获取一个字符串例如关于如何做到这一点有什么建议吗我是 Python 新手我还没有找到任何可以帮助解决此类问题的东西该列表将是 1 2 3 45 46 48 49 50 51 77 使用
如何计算 pandas 数据帧上的连续有序值

我试图从给定的数据帧中获取连续 0 值的最大计数其中包含来自 pandas 数据帧的 id date value 列如下所示 id date value 354 2019 03 01 0 354 2019 03 02 0 354 201
使用其构造函数初始化 OrderedDict 以便保留初始数据的顺序的正确方法？

初始化有序字典 OD 以使其保留初始数据的顺序的正确方法是什么 from collections import OrderedDict Obviously wrong because regular dict loses order d O
导入错误：没有名为 site 的模块 - mac

我已经有这个问题几个月了每次我想获取一个新的 python 包并使用它时我都会在终端中收到此错误 ImportError No module named site 我不知道为什么会出现这个错误实际上我无法使用任何新软件包因为每次我
Python Selenium：如何在文本文件中打印网站上的值？

我正在尝试编写一个脚本该脚本将从 tulsaspca org 网站获取以下 6 个值并将其打印在 txt 文件中最终输出应该是 905 4896 7105 23194 1004 42000 放置的动物的 HTML span class

随机推荐

如何确定Python中嵌套数据结构的类型？

我目前正在将一些 Python 翻译成 F 具体来说神经网络和深度学习为了确保数据结构正确转换需要 Python 中嵌套类型的详细信息这type 函数适用于简单类型但不适用于嵌套类型例如在 Python 中 gt data 1 2
创建缓冲区时“尚未创建缓冲区”

我有我认为是一个简单的 JFrame BufferStrategy 它是这样创建的 Buffer container createBufferStrategy 2 strategy container getBufferStrategy
代理对是如何计算的？

如果 unicode 代码点使用 17 位或更多则如何计算代理对 Unicode 代码点是范围从 0x000000 到 0x10FFFF 的标量值因此它们是 21 位整数而不是 17 位代理对是 UTF 16 形式的一种机制这将
AngularJS 模型

我正在尝试了解 AngularJS 我很喜欢它但我似乎忽略了一个核心概念模型在哪里例如如果我有一个显示多个交易列表的应用程序一个列表向服务器查询匹配某些条件的一组分页事务另一个列表使用不同的条件但可能有一些事务匹配这两个条件并
我可以在 Visual Studio 2008 中针对 .NET Framework 4 进行开发吗？

我的 ASP NET 应用程序在 Web 服务器上的 IIS 中运行并使用 Microsoft NET Framework 4 Beta 2 其应用程序池设置为 NET Framework 版本 NET Framework v4 0 21
AngularJS：指令无法访问隔离范围对象

我试图在具有隔离范围的指令中添加一些默认值基本上当我的指令被绑定时我需要使用作用域对象进行一些 DOM 操作下面是我的代码控制器 angular module ctrl controller TempCtrl function s
为什么这个苹果触摸图标不起作用？

我的网站中有以下代码当我在 Firefox 中查看源代码并单击 href 属性时图标会显示因此它不是 404 错误当代码添加到页面时例如http website com mobile index php or http websi
INSTALL_FAILED_USER_RESTRICTED ：使用 redmi 4 设备的 android studio

遇到这个奇怪的错误 Installation failed with message Failed to finalize session INSTALL FAILED USER RESTRICTED Install canceled by
matplotlib 颜色条中的小刻度

我目前正在尝试在颜色栏中设置小刻度但根本无法使其工作我尝试过 3 种方法参见下面的代码但它们似乎都不起作用颜色条中是否真的可能有微小的刻度 import numpy as np import matplotlib pyplot a
有符号零的最小值和最大值

我担心以下情况 min 0 0 0 0 max 0 0 0 0 minmag x x maxmag x x 根据维基百科 IEEE 754 2008说的是关于最小值和最大值定义了最小和最大操作但为输入值相等但表示不同的情况留有一些余地
如何在 matplotlib.pyplot.imshow 中使用“范围”

我设法绘制了我的数据并想为其添加背景图像地图数据是按长纬度值绘制的我也有图像三个角左上角右上角和左下角的长纬度值我试图弄清楚如何在 imshow 中使用范围选项然而我发现的例子并没有解释如何为每个角分配 x 和
prestashop 将图像添加到产品中

我有一个产品对象我正在 PHP 脚本中创建它我需要添加缩略图和大图像它们位于 zip 文件中文件名包含产品 ID 在代码中实现此目的的最佳方法是什么我假设我需要将图像提取到文件系统中的某个位置但我不知道 prestashop 如
JTable 准备编辑器如何工作

我不明白prepareEditor是如何工作的我无法使用prepareEditor中的Action设置prepareRenderer的可见性规则正如我在附图中捕获的那样第 1 行的规则按我的预期工作如果未选择 JCheckBox 也
错误 C2678：二进制“=”：找不到采用“const Recipe”类型的左侧操作数的运算符（或者没有可接受的转换）

我正在尝试对每个元素中包含一个 int 和一个字符串的向量进行排序它是一个类类型的向量称为向量食谱出现上述错误这是我的代码在我的 Recipe h 文件中 struct Recipe public string get cname
MySQL 的密钥文件不正确

我遇到了一个 InnoDB 表的问题表最初是 MyISAM 但不久前也将其转换为 InnodB 我正在尝试运行此查询 SELECT posts id posts post title FROM rss posts AS posts INN
在 jQuery 中创建 div 元素 [重复]

这个问题在这里已经有答案了我如何创建一个div元素在jQuery 从 jQuery 1 4 开始您可以将属性传递给自封闭元素如下所示 jQuery div id some id class some class some other
socket.error: [Errno 32] 管道损坏

我编写了一个客户端服务器 python 程序其中客户端将列表发送到服务器服务器接收数组删除列表的前两个元素并将其发送回客户端服务器接收列表没有问题但是当服务器想要发回编辑后的列表时它显示错误 socket error Errn
如何在 Visual Studio 中静态链接 VCPKG 生成的 .lib 文件

我使用 VCPKG 构建第三方库例如 libcurl 我有动态和静态构建显然导入 lib和对象 lib文件分别包含在两个不同的文件夹中 x64 windows和x64 windows static 我想将对象 libcurl lib
在 D3.js 中重新排序 SVG ( z-index ) 元素

我意识到这个问题以前已经被问过但我无法深入了解这是我的图表 http www gogeye com financialnews piechart index3 html 我想做的就是将硬币渲染在图表后面我知道 D3 渲染是按照附加顺序
如何查询pandas中的MultiIndex索引列值

代码示例 In 171 A np array 1 1 1 1 3 3 3 3 5 5 6 6 In 172 B np array 111 222 222 333 333 777 In 173 C randint 10 99 6 In 174

如何查询pandas中的MultiIndex索引列值

如何查询pandas中的MultiIndex索引列值 的相关文章

随机推荐

热门标签

如何查询pandas中的MultiIndex索引列值的相关文章