使用分组的多列熊猫绘制堆积条形图

2024-05-06

我有两个数据框，我需要获取它们之间的差异，然后在该差异之上绘制其中一个数据框。这是一个最小的例子：

import pandas as pd
import matplotlib.pyplot as plt

df1 = pd.DataFrame([[2,5,7,6,7],[4,4,4,4,3],[8,8,7,3,4],[16,10,12,13,16]], columns=["N", "A", "B", "C", "D"])
df2 = pd.DataFrame([[2,1,3,6,5],[4,1,2,3,2],[8,2,2,3,3],[16,8,10,3,11]], columns=["N", "A", "B", "C", "D"])

dfDiff = df1 - df2
dfDiff['N'] = df1['N']

# Individual barchart
colors = ['#6c8ebf', '#82b366', '#F7A01D', '#9876a7']
df1.set_index('N')[["A", "B", "C", "D"]].plot.bar(color=colors)
df2.set_index('N')[["A", "B", "C", "D"]].plot.bar(color=colors)

dfStacked = pd.DataFrame(columns=["N", "A", "A_diff", "B", "B_diff"])
dfStacked["N"] = df2["N"]
dfStacked["A"] = df2["A"]
dfStacked["B"] = df2["B"]
dfStacked["C"] = df2["C"]
dfStacked["D"] = df2["D"]
dfStacked["A_diff"] = dfDiff["A"]
dfStacked["B_diff"] = dfDiff["B"]
dfStacked["C_diff"] = dfDiff["C"]
dfStacked["D_diff"] = dfDiff["D"]

dfStacked.set_index('N').plot.bar(stacked=True)

plt.show()

The dataframes look like this: The thing is that now the new stacked one ends up with everything merged. I want to have "A" stacked with "A_diff", "B", stacked with "B_diff", "C" stacked with "C_diff" and "D" stacked with "D_diff". For example, I changed the code to do it with "A" and "A_diff" as dfStacked.set_index('N')[["A", "A_diff"]].plot.bar(stacked=True) which looks correct, but I want A,B,C and D grouped by N like in the first two figures.

我是否需要一个新的数据框，例如dfStacked？如果可以，应该以什么形式添加内容？我怎样才能保留same颜色但添加hatch="/" only对于“顶部”堆叠栏？

数据框如下所示会更好吗？：

df3 = pd.DataFrame(columns=["N", "Algorithm", "df1", "dfDiff"])
df3.loc[len(df3)] = [2, "A", 20, 10]
df3.loc[len(df3)] = [2, "A", 1, 4]
df3.loc[len(df3)] = [4, "A", 2, 3]
df3.loc[len(df3)] = [4, "A", 3, 4]
df3.loc[len(df3)] = [2, "B", 1, 3]
df3.loc[len(df3)] = [2, "B", 2, 4]
df3.loc[len(df3)] = [4, "B", 3, 3]
df3.loc[len(df3)] = [4, "B", 4, 2]

但如何按“N”和“算法”对它们进行分组呢？我的意思是，每一行对应一个条，只是它们应该按“N”与所有“算法”分组，最后两列是每个条的两个“部分”。颜色与前两个数字（对于“算法”）相匹配会很好，但是条形图的顶部有hatch="/"例如。

我将从df1, df2并得到dfStacked以稍微不同的方式：

import pandas as pd

df1 = pd.DataFrame(
    [
        [2,5,7,6,7],
        [4,4,4,4,3],
        [8,8,7,3,4],
        [16,10,12,13,16]
    ], 
    columns=["N", "A", "B", "C", "D"]
).set_index('N')

df2 = pd.DataFrame(
    [
        [2,1,3,6,5],
        [4,1,2,3,2],
        [8,2,2,3,3],
        [16,8,10,3,11]
    ], 
    columns=["N", "A", "B", "C", "D"]
).set_index('N')

dfStacked = pd.concat(
    [df1, df1-df2], 
    axis=1, 
    keys=['raw','diff']
).reorder_levels([1,0], axis=1)

现在我们有这个DataFrame:

要在按第一级堆叠的条形图中绘制这些数据，我们可以使用两个DataFrame.plot的特点——ax and bottom。第一个是应绘制条形图的轴的位置，第二个是条形底线应开始的值。详情请运行help(plt.bar)阅读有关bottom and help(pd.DataFrame.plot)阅读有关ax.

import matplotlib.pyplot as plt
from matplotlib.colors import TABLEAU_COLORS

plt.figure(figsize=(10,7))
ax = plt.gca()

names = dfStacked.columns.levels[0]
n = len(names)
color = iter(TABLEAU_COLORS)
w = 1/(n+2)       # width
h = '/'*5         # hatch for diff values
for i, name in enumerate(names):
    c = next(color)   # color
    p = n/2 - i       # position
    dfStacked[name]['raw'].plot.bar(
        ax=ax, 
        position=p, 
        width=w, 
        color=c,
        label=f'{name} raw'
    )
    dfStacked[name]['diff'].plot.bar(
        ax=ax, 
        bottom=dfStacked[name]['raw'], 
        hatch=h,
        position=p,
        width=w, 
        color=c,
        label=f'{name} diff'
    )

ax.set_xlim([-1, n])
ax.tick_params(axis='x', rotation=0)
ax.legend();

这是输出：

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用分组的多列熊猫绘制堆积条形图的相关文章

如何在 to_excel() 和 read_excel() 之间保留 pandas 多重索引？

根据 pandas 文档读取Excel http pandas pydata org pandas docs dev generated pandas io excel read excel html 我可以将索引列名称放在单独的行上然后
在 Pandas 数据框中显示对图

我试图通过从 pandas 数据框中的 scatter matrix 创建来显示一对图这就是创建配对图的方式 Create dataframe from data in X train Label the columns using th
Pandas 用单位插值数据

大家好几年来我一直在寻找 Stackoverflow 它对我帮助很大以至于我以前不需要注册但今天我遇到了一个使用 Python 与 Pandas 和 Quantities 也可能是 unum 或 pint 的问题我尽力发表清晰的帖子
仅选择多索引 DataFrame 的一个索引

我正在尝试仅使用多索引 DataFrame 中的一个索引创建一个新的 DataFrame A B C first second bar one 0 895717 0 410835 1 413681 two 0 805244 0 813850
获取 Pandas Dataframe 中列名的排名

我将客户 ID 与他们最常购买的表演类型进行比较 Genre Jazz Dance Music Theatre Customer 100000000001 0 3 1 2 100000000002 0 1 6 2 100000000003
使用 pandas 删除停用词

我想从数据框的列中删除停用词列内有需要拆分的文本例如我的数据框如下所示 ID Text 1 eat launch with me 2 go outside have fun 我想应用停用词text column所以应该分开我试过这个
如何使用groupby将多个函数应用于Pandas中的多个列？

我有一个正常的df A pd DataFrame 1 5 2 2 4 4 3 3 1 4 2 2 5 1 4 columns A B C index 1 2 3 4 5 下列的这个食谱 https stackoverflow com que
根据缺少标题的列将文件选项卡到 pandas 数据框中

如何将带有空列标题的选项卡文件转换为数据框更具体地说如何仅使用与相邻未标记列中的字母在本例中为 P 相对应的值来填充此数据框这是我正在使用的选项卡文件的表示请注意 A 或 P 列上缺少标题 gene cell 1 cell 2 M
Pandas：如何根据另一个数据框的值对数据框上的列求和

我是 Pandas 新手我正在尝试做以下事情我有一个名为的数据框comms包含articleID和commentScore列等等我有另一个名为arts带有列文章 ID 我需要创建arts一个名为文章评分每篇文章必须具有articl
如何使用 pandas 进行左连接

我有 2 个数据框它看起来像这样 DF1 Product Region ProductScore AAA R1 100 AAA R2 100 BBB R2 200 BBB R3 200 DF2 Region RegionScore R1
Pandas：向量化局部范围操作（[i:i+2] 行的最大值和总和）

我希望在数据帧中的每一行的局部范围内进行计算同时避免速度缓慢for环形例如对于下面数据中的每一行我想找到未来 3 天内包括当天的最高气温以及未来 3 天内的总降雨量 Day Temperature Rain 0 30 4 1 3
使用 Matplotlib、PyQt 和 Threading 进行实时绘图导致 python 崩溃

我一直在努力研究我的 Python 应用程序但找不到任何答案我有 PyQT GUI 应用程序它使用 Matplotlib 小部件 GUI 启动一个新线程来处理 mpl 小部件的绘图恐怕我现在通过从另一个线程访问 matplotlib
matplotlibplot_曲面图

matplotlib 教程提供了如何绘制球面的一个很好的示例 from mpl toolkits mplot3d import Axes3D import matplotlib pyplot as plt import numpy as n
使用 pandas 中的数据透视表进行加权平均

我编写了一些代码来使用 pandas 中的数据透视表计算加权平均值但是我不确定如何添加执行加权平均的实际列添加一个新列其中每行包含累积计数值数据看起来像这样 VALUE COUNT GRID agb 1 43 1476 10
将 github 上的包安装到 Spyder 中

我一直在尝试安装并导入mpl finance来自 github 的包在我的 Spyder 环境中没有成功我努力了 pip install e git https github com matplotlib mpl finance git
从列表中的数据框列中搜索部分字符串匹配 - Pandas - Python

我有一个清单 things A1 B2 C3 我有一个 pandas 数据框其中有一列包含用分号分隔的值某些行将包含与上面列表中的一项的匹配它不会是完美的匹配因为它在其中包含字符串的其他部分该列例如该列中的一行可能有哇这里
通过数据框与函数进行交互

如果我有这样的日期框架氮 EG 00 04 NEG 04 08 NEG 08 12 NEG 12 16 NEG 16 20 NEG 20 24 datum von 2017 10 12 21 69 15 36 0 87 1 42 0 76
循环标记时出现“ValueError：无法识别的标记样式 -d”

我正在尝试编码pyplot允许不同标记样式的绘图这些图是循环生成的标记是从列表中选取的为了演示目的我还提供了一个颜色列表版本是Python 2 7 9 IPython 3 0 0 matplotlib 1 4 3 这是一个简单的代
协方差矩阵的对角元素不是 1 pandas/numpy

我有以下数据框 A B 0 1 5 1 2 6 2 3 7 3 4 8 我想计算协方差 a df iloc 0 values b df iloc 1 values 使用 numpy 作为 cov numpy cov a b I get ar
有效地绘制大时间序列（matplotlib）

我正在尝试使用 matplotlib 在同一轴上绘制三个时间序列每个时间序列有 10 6 个数据点虽然生成图形没有问题但 PDF 输出很大在查看器中打开速度非常慢除了以栅格化格式工作或仅绘制时间序列的子集之外还有其他方法可以获得

随机推荐

Nodejs中的模拟电子邮件功能

我已经构建了一个邮件程序功能并试图加强覆盖范围事实证明尝试测试它的某些部分很棘手特别是这个 mailer smtpTransport sendMail var nodemailer require nodemailer var ma
App Engine 上的 HTTP 到 HTTPS 重定向灵活

我已经遵循了这个答案在谷歌云中从http重定向到https https stackoverflow com questions 37135051 redirect from http to https in google cloud但目前
在命令行上解密使用 PHP openssl_encrypt 制作的文件

我有一个要加密的字符串 encryptThis Super Secret Text echo openssl encrypt encryptThis aes 128 cbc 1234 FALSE F68A9A229A516752 然后我通过
在电子邮件中设置 html 样式

我正在为有能力的客户发送 HTML 版本的电子邮件现在这不是几乎全部吗我担心的是如何设计它我使用内联CSS吗我可以在 html 中包含样式表吗 html 是否以 or 我可以阅读这方面的标准吗我在造型方面能走多远我有边框半径背
C++ 中的模块路径到 Java JNI 调用

当我用 C 创建 Java 8 JVM 时我通常使用类似以下代码的内容来告诉 JVM 类路径 JavaVMOption options new JavaVMOption 1 JVM invocation options options 0
指向二维数组的指针和手动内存管理 - C

我认为用纯 C 语言构建一个库来处理各种矩阵计算将是一个很好的挑战现在尽管我在 Objective C 和 Cocoa 方面有一些很好的经验但我对 C 的了解正是我所需要的与 Objective C 一起工作仅此而已例如我熟悉
编译错误：computeFrames 选项不支持 JSR/RET

当我编译 java 文件时在 IntelliJ 项目上出现此错误没有列出特定的源文件但它失败并出现此错误删除以下编译器标志可修复该错误 source 1 5 target 1 5 然而这些需要在那里因为我们的目标是 Java 5
Hibernate vs JPA vs JDO - 各自的优缺点？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我熟悉 ORM 这个概念几年前我什至在 NET 项目中使用过 nHibernate 然而我还没有跟上 Java 中 ORM 的主题
iOS Objective-C 对象：何时使用release，何时不使用它

我在 iOS 下正在使用 delphi Tokyo 进行开发这是我的代码 aUIImage TUIImage Wrap TUIImage alloc initWithCGImage aCGImageRef try aData TNSDa
Hibernate/JPA 在启动时不验证数据库架构

由于某种原因 hibernate 无法捕获诸如将实体映射到不存在的表之类的问题我的 persistence xml 文件看起来像这样
通过 adb 将触摸事件发送到设备[重复]

这个问题在这里已经有答案了我正在尝试使用以下方式将触摸事件发送到设备adb shell命令这样我就可以为 UI 测试做一些基本的自动化我已经关注了之前一些关于此问题的讨论我确认了获取事件并使用sendevent 为每次触摸发送 6
ANSI C，整数到字符串，不带可变参数函数

我目前正在使用支持 ANSI C 的 PLC 但使用它自己的 GNU 编译器风格它不编译任何可变参数函数和 itoa 之类的东西所以使用 sprintf co 不是将整数转换为字符串的选项任何人都可以引导我到一个列出了健壮的无 sp
NotificationCompact.Builder 和 ActionBarSherlock 的问题

在下面的代码中 Eclipse发现错误 The method build is undefined for the type NotificationCompat Builder 在添加之前一切正常ActionBarSherlock htt
onClick 在 p 标签上无法正常工作

我想为每个绑定一个点击事件 p 但它似乎不能正常工作当我运行脚本时我立即收到三个警报我只想在单击三个中的任何一个时获得它们 p p s 谁能告诉我我做错了什么编辑抱歉这就是它的样子 HTML 应该是这样的 p p class s
Laravel 4 JSON 响应与 Cookie

如何设置带有 json 响应的 cookie 我注意到至少对我来说以下命令是唯一可以设置 cookie 的命令 return Redirect to gt withCookie Cookie make blog cookie value
将 Typescript 项目打包为可执行文件

如何将 Typescript 项目打包成可执行文件由于我找了一段时间没有找到所以我使用了 now 节点来实现上述目的我正在发布我所做的事情希望有人会觉得它有用将Typescript项目编译成node 根据this https me
使用 ABAddressBookRegisterExternalChangeCallback 注册的地址簿更改回调永远不会被调用 (iOS 8)

我已经找到了很多与此相关的示例但在阅读整个 ABAddressBook 文档后我仍然无法弄清楚为什么在我的情况下我的更改回调没有被调用我只是设置了一个地址簿并为其注册了一个回调函数我可以很好地访问地址簿但无论我在联系人应用程
Vue 3：“defineProps”引用本地声明的变量

为什么我收到警告错误消息 defineProps引用本地声明的变量 eslint vue valid define props 当我在 props 中使用自定义验证器时SFC
escape()、encodeURI()、encodeURIComponent() 之间的区别

在 JavaScript 中它们之间有什么区别 escape unescape encodeuri decodeuri encodeURIComponent decodeURIComponent 对于有视觉头脑的人来说这里有一个表格显示
使用分组的多列熊猫绘制堆积条形图

我有两个数据框我需要获取它们之间的差异然后在该差异之上绘制其中一个数据框这是一个最小的例子 import pandas as pd import matplotlib pyplot as plt df1 pd DataFrame 2

使用分组的多列熊猫绘制堆积条形图

使用分组的多列熊猫绘制堆积条形图 的相关文章

随机推荐

热门标签

使用分组的多列熊猫绘制堆积条形图的相关文章