将多索引转换为行式多维 NumPy 数组。

2024-05-14

假设我有一个类似于以下示例的 MultiIndex DataFrame多索引文档 http://pandas.pydata.org/pandas-docs/stable/advanced.html.

>>> df 
               0   1   2   3
first second                
bar   one      0   1   2   3
      two      4   5   6   7
baz   one      8   9  10  11
      two     12  13  14  15
foo   one     16  17  18  19
      two     20  21  22  23
qux   one     24  25  26  27
      two     28  29  30  31

我想从这个 DataFrame 生成一个具有 3 维结构的 NumPy 数组，例如

>>> desired_arr
array([[[ 0,  4],
        [ 1,  5],
        [ 2,  6],
        [ 3,  7]],

       [[ 8, 12],
        [ 9, 13],
        [10, 14],
        [11, 15]],

       [[16, 20],
        [17, 21],
        [18, 22],
        [19, 23]],

       [[24, 28],
        [25, 29],
        [26, 30],
        [27, 31]]])

我怎样才能这样做?

希望这里发生的事情很清楚 - 我通过第一级有效地取消了 DataFrame 的堆叠，然后尝试将结果列 MultiIndex 中的每个顶层转换为它自己的二维数组。

我可以做到一半

>>> df.unstack(1)
         0       1       2       3    
second one two one two one two one two
first                                 
bar      0   4   1   5   2   6   3   7
baz      8  12   9  13  10  14  11  15
foo     16  20  17  21  18  22  19  23
qux     24  28  25  29  26  30  27  31

但随后我正在努力寻找一种好方法将每一列转换为二维数组，然后将它们连接在一起，而不仅仅是使用循环和列表显式地这样做。

我觉得应该有某种方法让我预先指定我想要的 NumPy 数组的形状，用np.nan然后使用特定的迭代顺序用我的 DataFrame 填充值，但我还没有设法用这种方法解决问题。

生成示例 DataFrame

iterables = [['bar', 'baz', 'foo', 'qux'], ['one', 'two']]
ind = pd.MultiIndex.from_product(iterables, names=['first', 'second'])
df = pd.DataFrame(np.arange(8*4).reshape((8, 4)), index=ind)

Some reshape https://docs.scipy.org/doc/numpy/reference/generated/numpy.reshape.html and swapaxes https://docs.scipy.org/doc/numpy-1.10.0/reference/generated/numpy.swapaxes.html magic -

df.values.reshape(4,2,-1).swapaxes(1,2)

可概括为 -

m,n = len(df.index.levels[0]), len(df.index.levels[1])
arr = df.values.reshape(m,n,-1).swapaxes(1,2)

基本上将第一个轴分成两个长度4 and 2创建一个3D数组，然后交换最后两个轴，即推入长度轴2到后面（作为最后一个）。

示例输出 -

In [35]: df.values.reshape(4,2,-1).swapaxes(1,2)
Out[35]: 
array([[[ 0,  4],
        [ 1,  5],
        [ 2,  6],
        [ 3,  7]],

       [[ 8, 12],
        [ 9, 13],
        [10, 14],
        [11, 15]],

       [[16, 20],
        [17, 21],
        [18, 22],
        [19, 23]],

       [[24, 28],
        [25, 29],
        [26, 30],
        [27, 31]]])

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

NumPy

DataFrame

将多索引转换为行式多维 NumPy 数组。的相关文章

pandas 替换多个值

以下是示例数据框 gt gt gt df pd DataFrame a 1 1 1 2 2 b 11 22 33 44 55 gt gt gt df a b 0 1 11 1 1 22 2 1 33 3 2 44 4 3 55 现在我想根据
R 中的列乘以子字符串

假设我有一个数据框其中包含多个组件及其在多个列中列出的属性并且我想对这些列运行多个函数我的方法是尝试将其基于每个列标题中的子字符串但我无法弄清楚如何做到这一点下面是数据框的示例 Basket F Type 1 F Qty 1 F
SQL Alchemy 中的 NULL 安全不等式比较？

目前我知道如何表达 NULL 安全的唯一方法 SQL Alchemy 中的比较其中与 NULL 条目的比较计算结果为 True 而不是 NULL 是 or field None field value 有没有办法在 SQL Alchem
如何使用 Scrapy 从网站获取所有纯文本？

我希望在 HTML 呈现后可以从网站上看到所有文本我正在使用 Scrapy 框架使用 Python 工作和xpath body text 我能够获取它但是带有 HTML 标签而且我只想要文本有什么解决办法吗最简单的选择是ext
Spark的distinct()函数是否仅对每个分区中的不同元组进行洗牌

据我了解 distinct 哈希分区 RDD 来识别唯一键但它是否针对仅移动每个分区的不同元组进行了优化想象一个具有以下分区的 RDD 1 2 2 1 4 2 2 1 3 3 5 4 5 5 5 在此 RDD 上的不同键上所有重复键
为 pandas 数据透视表中的每个值列定义 aggfunc

试图生成具有多个值列的数据透视表我知道我可以使用 aggfunc 按照我想要的方式聚合值但是如果我不想对两列求和或求平均值而是想要一列的总和同时求另一列的平均值该怎么办那么使用 pandas 可以做到这一点吗 df pd D
安装后 Anaconda 提示损坏

我刚刚安装张量流GPU创建单独的后环境按照以下指示here https github com antoniosehk keras tensorflow windows installation 但是安装后当我关闭提示窗口并打开新航站楼弹出
从 scikit-learn 导入 make_blobs [重复]

这个问题在这里已经有答案了我收到下一个警告 D Programming Python ML venv lib site packages sklearn utils deprecation py 77 DeprecationWarning
Pandas Dataframe 中 bool 值的条件前向填充

问题如何转发 fill boolTruepandas 数据框中的值如果是当天的第一个条目 True 到一天结束时请参阅以下示例和所需的输出 Data import pandas as pd import numpy as np df
通过数据框与函数进行交互

如果我有这样的日期框架氮 EG 00 04 NEG 04 08 NEG 08 12 NEG 12 16 NEG 16 20 NEG 20 24 datum von 2017 10 12 21 69 15 36 0 87 1 42 0 76
如何将 PIL 图像转换为 NumPy 数组？

如何转换 PILImage来回转换为 NumPy 数组这样我就可以比 PIL 进行更快的像素级转换PixelAccess允许我可以通过以下方式将其转换为 NumPy 数组 pic Image open foo jpg pix numpy
Python：计算字典的重复值

我有一本字典如下 dictA unit1 test1 alpha unit1 test2 beta unit2 test1 alpha unit2 test2 gamma unit3 test1 delta unit3 test2 gamm
设置 torch.gather(...) 调用的结果

我有一个形状为 n x m 的 2D pytorch 张量我想使用索引列表来索引第二个维度可以使用 torch gather 完成然后然后还设置新值到索引的结果 Example data torch tensor 0 1 2 3 4
用于运行可执行文件的python多线程进程

我正在尝试将一个在 Windows 上运行可执行文件并管理文本输出文件的 python 脚本升级到使用多线程进程的版本以便我可以利用多个核心我有四个独立版本的可执行文件每个线程都知道要访问它们这部分工作正常我遇到问题的地方是当它们
从 Python 中的类元信息对 __init__ 函数进行类型提示

我想做的是复制什么SQLAlchemy确实以其DeclarativeMeta班级有了这段代码 from sqlalchemy import Column Integer String from sqlalchemy ext declar
循环标记时出现“ValueError：无法识别的标记样式 -d”

我正在尝试编码pyplot允许不同标记样式的绘图这些图是循环生成的标记是从列表中选取的为了演示目的我还提供了一个颜色列表版本是Python 2 7 9 IPython 3 0 0 matplotlib 1 4 3 这是一个简单的代
Spark.read 在 Databricks 中给出 KrbException

我正在尝试从 databricks 笔记本连接到 SQL 数据库以下是我的代码 jdbcDF spark read format com microsoft sqlserver jdbc spark option url jdbc sql
Python - 字典和列表相交

给定以下数据结构找出这两种数据结构共有的交集键的最有效方法是什么 dict1 2A 3A 4B list1 2A 4B Expected output 2A 4B 如果这也能产生更快的输出我可以将列表不是 dict1 组织到任何其他数
改变字典的哈希函数

按照此question https stackoverflow com questions 37100390 towards understanding dictionaries 我们知道两个不同的字典 dict 1 and dict 2例
PyAudio ErrNo 输入溢出 -9981

我遇到了与用户相同的错误 Python 使用 Pyaudio 以 16000Hz 录制音频时出错 https stackoverflow com questions 12994981 python error audio recording

随机推荐

Vim 函数插入带有传递参数的静态文本

背景 I m interested in writing a function that assigned to keyboard shortcut s when invoked would 采取用户参数计算值反映80 string le
ASP.NET MVC运行IIS7部署问题

我在将 ASP NET MVC 应用程序部署到 IIS7 时遇到问题我有一个使用 ASP NET MVC Beta 1 创建的 MVC 项目它仅包含未修改的默认模板该应用程序在 VS2008 中运行得很好但是当我将其发布到本地 II
Woocommerce 获取产品

我使用以下代码从我的 WordPress 网站中的 WooCommerce 获取产品类别列表
如何在动态执行的代码字符串中使用inspect.getsource？

如果我在文件中有这段代码 import inspect def sample p1 print p1 return 1 print inspect getsource sample 当我运行脚本时它按预期工作在最后一行源代码sampl
维护一组通用的 Eclipse 首选项

每当我切换工作区 Eclipse 安装时我都需要复制重做首选项编译器设置字体大小系列代码格式化程序 java代码模板编辑器模板代码清理我想以统一的方式维护这些设置最好是在源代码控制下我怎样才能做到这一点我知道创建新工
如何从控制器访问片段中的片段？

我有一个名为 cutleryCustomerSearch 的视图其中包含替换一个片段 div div div div 在此片段中我有一个表我喜欢通过 ajax 更新它 table 我如何设置处理 ajax 请求的控制器方法的返回
如何调试 numpy 掩码

这个问题与this one https stackoverflow com q 73672739 11004423 我有一个正在尝试矢量化的函数这是原来的函数 def aspect good angle float planet1 goo
Keycloak：使用新的 Chrome SameSite/Secure cookie 强制执行时，令牌请求中缺少会话 cookie

最近我使用 Keycloak 的应用程序在身份验证后停止处理 400 令牌请求到目前为止我发现在令牌请求中 Keycloak cookie AUTH SESSION ID KEYCLOAK IDENTITY KEYCLOAK SESS
当我从本地计算机更改为虚拟主机时，从 python 脚本调用 pdftotext 不起作用

我编写了一个小的 python 脚本来解析提取 PDF 中的信息我在本地机器上测试了它我有 python 2 6 2 和 pdftotext 版本 0 12 4 我正在尝试在我的虚拟主机服务器 dreamhost 上运行它它有 py
使用pivot_longer将R中的多列变成一列[重复]

这个问题在这里已经有答案了我有一个dfpopulation看起来像这样未列出所有列和行 Region X1975 X1976 X1977 X2008 National Total 942420 93717 94974 132802 Be
Flutter：一张带有圆形头像的卡片，非常引人注目

我想做一张卡片CircleAvatar 突出显示您可以在这张图片中看到详细信息我不知道它是如何工作的我尝试了一些Stack和定位小部件但它不起作用 Stack确实是解决方案 Stack children
Amazon Lex 和 BotFramework 集成 TypeError：无法对已在响应中撤销的代理执行“get”[重复]

这个问题在这里已经有答案了我正在进行概念验证尝试将 BotFramework 与 Amazon lex 集成并最终将机器人集成到 Microsoft 团队渠道 AWS SDK 用于调用 Amazon Lex 自动程序 async ca
无法在 Google Cloud Run 上部署 Ubuntu 20.04 Docker 容器

我正在尝试通过 Google Cloud Run 部署一个基于 Ubuntu 20 04 的简单的基于 Python 的 Docker 容器我已经成功构建了映像但是当我尝试部署 Cloud Run 服务时出现以下错误省略了项目详细信
C# 如何单击 IList 中的 IWebelement？

所以我尝试单击 YouTube 上的按钮但我无法通过 Xpath 找到该按钮因为按钮太多所以我尝试将它们保存在 IList 中现在我想单击列表中的特定按钮 ChromeDriver chrome new ChromeDriver L
从基础创建 Uri，不带尾部斜杠和相关部分

我的 Uri 构造函数有问题基本路径是否以斜杠结尾的结果会有所不同 var baseWithSlash new Uri c Temp var baseNoSlash new Uri c Temp var relative MyApp va
ExpandableLabel iOS 中的“少看”

我正在使用第三方库可扩展标签 https github com apploft ExpandableLabel实施一个see more特征我正在寻找仅快速的解决方案其中包含标签中的文本而不是按钮中的文本因此这可以完美地工作添加库并更
如何在 numpy 数组中查找并保存重复的行？

我有一个数组例如 Array 1 1 1 2 2 2 3 3 3 4 4 4 5 5 5 1 1 1 2 2 2 我想要输出以下内容的东西 Repeated 1 1 1 2 2 2 保留重复行的数量也可以例如 Repeated 1 1
如何清除Android剪贴板？

我发现的方法都不起作用这是我尝试过的 1 使用clearPrimaryClip 的方法ClipboardManager class ClipboardManager clipboard ClipboardManager getSystem
将错误保存到 MySQL 数据库

我有一个 php 查询来更新 MySQL 数据库请参见下文 sql update hr payroll set payroll number payroll number tax code tax bacs ref bacs ref pa
将多索引转换为行式多维 NumPy 数组。

假设我有一个类似于以下示例的 MultiIndex DataFrame多索引文档 http pandas pydata org pandas docs stable advanced html gt gt gt df 0 1 2 3 fir

将多索引转换为行式多维 NumPy 数组。

将多索引转换为行式多维 NumPy 数组。 的相关文章

随机推荐

热门标签

将多索引转换为行式多维 NumPy 数组。的相关文章