Pandas unstack问题：ValueError：索引包含重复条目，无法重塑

2023-12-14

我正在尝试用 pandas 解开多索引，并且不断收到：

ValueError: Index contains duplicate entries, cannot reshape

给定一个包含四列的数据集：

id（字符串）
日期（字符串）
位置（字符串）
值（浮点数）

我首先设置了三级多索引：

In [37]: e.set_index(['id', 'date', 'location'], inplace=True)

In [38]: e
Out[38]: 
                                    value
id           date       location       
id1          2014-12-12 loc1        16.86
             2014-12-11 loc1        17.18
             2014-12-10 loc1        17.03
             2014-12-09 loc1        17.28

然后我尝试取消堆叠位置：

In [39]: e.unstack('location')
---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-39-bc1e237a0ed7> in <module>()
----> 1 e.unstack('location')
...
C:\Anaconda\envs\sandbox\lib\site-packages\pandas\core\reshape.pyc in _make_selectors(self)
    143 
    144         if mask.sum() < len(self.index):
--> 145             raise ValueError('Index contains duplicate entries, '
    146                              'cannot reshape')
    147 

ValueError: Index contains duplicate entries, cannot reshape

这里发生了什么？

这是一个示例 DataFrame，它显示了这一点，它具有具有相同索引的重复值。问题是，您想要聚合这些还是将它们保留为多行？

In [11]: df
Out[11]:
   0  1  2      3
0  1  2  a  16.86
1  1  2  a  17.18
2  1  4  a  17.03
3  2  5  b  17.28

In [12]: df.pivot_table(values=3, index=[0, 1], columns=2, aggfunc='mean')  # desired?
Out[12]:
2        a      b
0 1
1 2  17.02    NaN
  4  17.03    NaN
2 5    NaN  17.28

In [13]: df1 = df.set_index([0, 1, 2])

In [14]: df1
Out[14]:
           3
0 1 2
1 2 a  16.86
    a  17.18
  4 a  17.03
2 5 b  17.28

In [15]: df1.unstack(2)
ValueError: Index contains duplicate entries, cannot reshape

一种解决方案是reset_index（然后回到df）并使用pivot_table.

In [16]: df1.reset_index().pivot_table(values=3, index=[0, 1], columns=2, aggfunc='mean')
Out[16]:
2        a      b
0 1
1 2  17.02    NaN
  4  17.03    NaN
2 5    NaN  17.28

另一种选择（如果您不想聚合）是附加一个虚拟级别，将其取消堆叠，然后删除虚拟级别...

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

Pandas unstack问题：ValueError：索引包含重复条目，无法重塑的相关文章

如何使用固定的 pandas 数据框进行动态 matplotlib 绘图？

我有一个名为的数据框benchmark returns and strategy returns 两者具有相同的时间跨度我想找到一种方法以漂亮的动画风格绘制数据点以便它显示逐渐加载的所有点我知道有一个matplotlib animat
如何打印没有类型的defaultdict变量？

在下面的代码中 from collections import defaultdict confusion proba dict defaultdict float for i in xrange 10 confusion proba di
Flask 和 uWSGI - 无法加载应用程序 0 (mountpoint='')（找不到可调用或导入错误）

当我尝试使用 uWSGI 启动 Flask 时出现以下错误我是这样开始的 gt cd gt root localhost uwsgi socket 127 0 0 1 6000 file path to folder run py ca
如何等到 Excel 计算公式后再继续 win32com

我有一个 win32com Python 脚本它将多个 Excel 文件合并到电子表格中并将其另存为 PDF 现在的工作原理是输出几乎都是 NAME 因为文件是在计算 Excel 文件内容之前输出的这可能需要一分钟如何强制工作簿计算值
如何使用装饰器禁用某些功能的中间件？

我想模仿的行为csrf exempt see here https docs djangoproject com en 1 11 ref csrf django views decorators csrf csrf exempt and h
keras加载模型错误尝试将包含17层的权重文件加载到0层的模型中

我目前正在使用 keras 开发 vgg16 模型我用我的一些图层微调 vgg 模型拟合我的模型训练后我保存我的模型model save name h5 可以毫无问题地保存但是当我尝试使用以下命令重新加载模型时load mod
运行多个 scrapy 蜘蛛的正确方法

我只是尝试使用在同一进程中运行多个蜘蛛新的 scrapy 文档 http doc scrapy org en 1 0 topics practices html但我得到 AttributeError CrawlerProcess objec
从列表中的数据框列中搜索部分字符串匹配 - Pandas - Python

我有一个清单 things A1 B2 C3 我有一个 pandas 数据框其中有一列包含用分号分隔的值某些行将包含与上面列表中的一项的匹配它不会是完美的匹配因为它在其中包含字符串的其他部分该列例如该列中的一行可能有哇这里
在 NumPy 中获取 ndarray 的索引和值

我有一个 ndarrayA任意维数N 我想创建一个数组B元组数组或列表其中第一个N每个元组中的元素是索引最后一个元素是该索引的值A 例如 A array 1 2 3 4 5 6 Then B 0 0 1 0 1 2 0 2 3 1 0
feedparser 在脚本运行期间失败，但无法在交互式 python 控制台中重现

当我运行 eclipse 或在 iPython 中运行脚本时它失败了 ascii codec can t decode byte 0xe2 in position 32 ordinal not in range 128 我不知道为什么但
Pandas Dataframe 中 bool 值的条件前向填充

问题如何转发 fill boolTruepandas 数据框中的值如果是当天的第一个条目 True 到一天结束时请参阅以下示例和所需的输出 Data import pandas as pd import numpy as np df
当玩家触摸屏幕一侧时，如何让 pygame 发出警告？

我使用 pygame 创建了一个游戏当玩家触摸屏幕一侧时我想让 pygame 给出类似你不能触摸屏幕两侧的错误我尝试在互联网上搜索但没有找到任何好的结果我想过在屏幕外添加一个方块当玩家触摸该方块时它会发出警告但这花了很长
ExpectedFailure 被计为错误而不是通过

我在用着expectedFailure因为有一个我想记录的错误我现在无法修复但想将来再回来解决我的理解expectedFailure是它会将测试计为通过但在摘要中表示预期失败的数量为 x 类似于它如何处理跳过的 tets 但是当我
循环中断打破tqdm

下面的简单代码使用tqdm https github com tqdm tqdm在循环迭代时显示进度条 import tqdm for f in tqdm tqdm range 100000000 if f gt 100000000 4 b
Python：计算字典的重复值

我有一本字典如下 dictA unit1 test1 alpha unit1 test2 beta unit2 test1 alpha unit2 test2 gamma unit3 test1 delta unit3 test2 gamm
在 Pandas DataFrame Python 中添加新列[重复]

这个问题在这里已经有答案了例如我在 Pandas 中有数据框 Col1 Col2 A 1 B 2 C 3 现在如果我想再添加一个名为 Col3 的列并且该值基于 Col2 式中如果Col2 gt 1 则Col3为0 否则为1 所以
glpk.LPX 向后兼容性？

较新版本的glpk没有LPXapi 旧包需要它我如何使用旧包例如COBRA http opencobra sourceforge net openCOBRA Welcome html 与较新版本的glpk 注意COBRA适用于 MATL
如何使用google colab在jupyter笔记本中显示GIF？

我正在使用 google colab 想嵌入一个 gif 有谁知道如何做到这一点我正在使用下面的代码它并没有在笔记本中为 gif 制作动画我希望笔记本是交互式的这样人们就可以看到代码的动画效果而无需运行它我发现很多方法在 Goo
Python - 字典和列表相交

给定以下数据结构找出这两种数据结构共有的交集键的最有效方法是什么 dict1 2A 3A 4B list1 2A 4B Expected output 2A 4B 如果这也能产生更快的输出我可以将列表不是 dict1 组织到任何其他数
PyAudio ErrNo 输入溢出 -9981

我遇到了与用户相同的错误 Python 使用 Pyaudio 以 16000Hz 录制音频时出错 https stackoverflow com questions 12994981 python error audio recording

随机推荐

Mockito：将真实对象注入私有@Autowired字段

我正在使用 Mockito 的 Mock and InjectMocks注释将依赖项注入到用 Spring 注释的私有字段中 Autowired RunWith MockitoJUnitRunner class public class D
Spock 框架：间谍问题

我在 Spock 中使用 Spy 时遇到问题它要么无法正常工作要么我的理解是错误的所以我试图澄清这一点考虑这段代码 Java public class CallingClass public String functionOne d
无法关闭 ng-bootstrap Modal

所以我有一个NgbModal其中有一个表单我想要实现的是在成功提交后关闭它这是我的模态组件 Component selector create update transaction templateUrl CreateOrUpdateT
尝试使用多部分文件测试休息服务

我正在尝试测试我创建的休息服务服务是一个岗位我想创建一个文件来传递参数包括多部分文件此时我正尝试从那里调用该服务很确定这项服务不起作用但是当我打电话给休息服务时我有一个简单的表单只传递几个值包括 jpg 这是代码 Http
读取时数据从内存流中被截断

我有以下代码正在使用StreamWriter写信给MemoryStream 但是当我尝试读回流时我得到的数据被截断 using var outStream new MemoryStream using var outWriter new
Java：如何在打开另一个 JFrame 时关闭一个 JFrame？

我的程序以 JFrame 中带有文本字段的图片开始我希望当用户输入 start 时它会关闭图片 JFrame 并使用主程序打开另一个 JFrame 我试过了 processEvent new WindowEvent this Windo
类不是抽象的，并且不会重写抽象方法

因此我一直在为我的编程课做抽象作业但遇到了问题我现在的目标是能够使用抽象然后能够用矩形和椭圆形绘制一个简单的城市例如矩形建筑物或灯柱上的椭圆形灯我编译时收到的错误是 MyTestApp Rectangle 不是抽象的并且不会覆
如何使用显式成员映射配置 AutoMapper 实现多态性？

考虑以下基本情况 Mapper CreateMap
如何从 iPhone 使用 HTTP POST 上传音频文件？

我正在尝试将 caf 格式的音频文件从 iPhone 上传到网络服务器下面给出了所使用的代码问题是我没有上传任何文件 PHP echo 中没有文件名的输出任何帮助将不胜感激我在iPhone端使用的代码是 NSData fileDa
如何逐行读取Matlab mex函数的输入矩阵？

我需要创建一个 Matlab mex 函数它将接受输入矩阵并返回矩阵对角线 Input 1 2 3 4 5 6 预期输出 1 2 3 0 0 0 0 0 0 4 5 6 我的问题是由于 Matlab 按列而不是按行读取矩阵因此我的 m
如何使用php获取包含特殊字符的字符串的第一个字符？

I used string 0 缩短并显示用户名姓氏的第一个字符在用户名以等特殊字符开头之前它的效果非常好例如 name ber echo name 0 echoes nothing 同时我正在使用mb substr string
单击菜单项时pyqt系统托盘图标退出

我是python和pyqt的新手今天学习它们并写了一个小系统托盘恶魔它运行但是当我单击关于然后关闭对话框时应用程序退出我不知道为什么简单代码如下 import sys from PyQt4 import QtGui clas
使用 Retrofit 解析动态未知命名数组 Json

我是改造新手下面是 json response success servicecode 134 forecast month jan id 1 price 12 Product 1086 Qty 14 date 2018 10 27 16
无法在 Chrome v76 中隐藏“Chrome 正在被自动化软件控制”信息栏

将 Chrome 更新到版本 76 后我不知道如何隐藏覆盖页面上某些控件的 Chrome 正在被自动化软件控制通知 ChromeDriver 的最新稳定版本确实是 76 0 3809 68 以下代码适用于 Chrome 75 和 Chr
Spring Data Repository 的方面建议不起作用

我正在尝试为存储库创建一些切入点和建议之前以便在 Spring Boot 中的 Spring Data 中启用对实体管理器的某些存储库的过滤我的项目中也有 Web 和服务层 AspectLogging 适用于两者但我不能对存储库做同样
如何创建每个类别的链接

我正在尝试创建一个显示所有类别的导航栏然后通过单击每个类别它会链接到该类别中的所有帖子我在下面尝试过它显示所有类别但不显示为链接 for category in site categories div class categori
更改框架版本会导致：无法加载文件或程序集PresentationFramework？

我正在开发WPF应用程序该应用程序首先针对3 0框架当我尝试使其在 4 0 上运行时出现以下异常 System IO FileNotFoundException 是未处理的消息无法加载文件或装配 PresentationFram
将值从一个字段拆分为两个字段

我有一个表字段membername其中包含用户的姓氏和名字是否可以将它们分成 2 个字段memberfirst memberlast 所有记录均采用名字姓氏格式不带引号且中间有空格不幸的是 MySQL 没有分割字符串的功能但是您
如何重建bluez

我怎样才能重建bluez 是否可以例如我想更改 avctp c 中的某些内容我从他们的网站下载了最新的 bluez 版本并进行了我需要进行的更改现在我如何才能使更改生效即我需要做什么来重建蓝牙注意我使用的是Ubuntu 12
Pandas unstack问题：ValueError：索引包含重复条目，无法重塑

我正在尝试用 pandas 解开多索引并且不断收到 ValueError Index contains duplicate entries cannot reshape 给定一个包含四列的数据集 id 字符串日期字符串位置字符串

Pandas unstack问题：ValueError：索引包含重复条目，无法重塑

Pandas unstack问题：ValueError：索引包含重复条目，无法重塑 的相关文章

随机推荐

热门标签

Pandas unstack问题：ValueError：索引包含重复条目，无法重塑的相关文章