Pandas 堆积条形图中元素的排序

2024-05-17

我正在尝试绘制有关某个地区 5 个地区的家庭在特定行业赚取的收入比例的信息。

我使用 groupby 按地区对数据框中的信息进行排序：

df = df_orig.groupby('District')['Portion of income'].value_counts(dropna=False)
df = df.groupby('District').transform(lambda x: 100*x/sum(x))
df = df.drop(labels=math.nan, level=1)
ax = df.unstack().plot.bar(stacked=True, rot=0)
ax.set_ylim(ymax=100)

display(df.head())

    District  Portion of income
    A         <25%                 12.121212
              25 - 50%              9.090909
              50 - 75%              7.070707
              75 - 100%             2.020202

由于此收入属于类别，因此我想以合乎逻辑的方式对堆叠栏中的元素进行排序。 Pandas 生成的图表如下。现在，顺序（从每个条形的底部开始）是：

25 - 50%
50 - 75%
75 - 100%
<25%
Unsure

我意识到这些是按字母顺序排序的，并且很好奇是否有办法设置自定义排序。为了直观起见，我希望顺序是（同样，从栏的底部开始）：

Unsure
<25%
25 - 50%
50 - 75%
75 - 100%

然后，我想翻转图例以显示该顺序的相反内容（即，我希望图例顶部有 75 - 100，因为这就是条形顶部的内容）。

要对收入类别施加自定义排序顺序，一种方法是将它们转换为CategoricalIndex.

要反转 matplotlib 图例条目的顺序，请使用get_legend_handles_labels这个SO问题的方法：反转图例顺序熊猫情节 https://stackoverflow.com/questions/35373714/reverse-legend-order-pandas-plot

import pandas as pd
import numpy as np
import math

np.random.seed(2019)

# Hard-code the custom ordering of categories
categories = ['unsure', '<25%', '25 - 50%', '50 - 75%', '75 - 100%']

# Generate some example data
# I'm not sure if this matches your input exactly
df_orig = pd.DataFrame({'District': pd.np.random.choice(list('ABCDE'), size=100), 
                        'Portion of income': np.random.choice(categories + [np.nan], size=100)})

# Unchanged from your code. Note that value_counts() returns a 
# Series, but you name it df
df = df_orig.groupby('District')['Portion of income'].value_counts(dropna=False)
df = df.groupby('District').transform(lambda x: 100*x/sum(x))

# In my example data, np.nan was cast to the string 'nan', so 
# I have to drop it like this
df = df.drop(labels='nan', level=1)

# Instead of plotting right away, unstack the MultiIndex
# into columns, then convert those columns to a CategoricalIndex 
# with custom sort order
df = df.unstack()

df.columns = pd.CategoricalIndex(df.columns.values, 
                                 ordered=True, 
                                 categories=categories)

# Sort the columns (axis=1) by the new categorical ordering
df = df.sort_index(axis=1)

# Plot
ax = df.plot.bar(stacked=True, rot=0)
ax.set_ylim(ymax=100)

# Matplotlib idiom to reverse legend entries 
handles, labels = ax.get_legend_handles_labels()
ax.legend(reversed(handles), reversed(labels))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

matplotlib

plot

Pandas 堆积条形图中元素的排序的相关文章

在python中将文本文件解析为列表

我对 Python 完全陌生我正在尝试读取包含单词和数字组合的 txt 文件我可以很好地读取 txt 文件但我正在努力将字符串转换为我可以使用的格式 import matplotlib pyplot as plt import num
Python 3 __getattribute__ 与点访问行为

我读了一些关于 python 的对象属性查找的内容这里 https blog ionelmc ro 2015 02 09 understanding python metaclasses object attribute lookup h
优化 Keras 以使用所有可用的 CPU 资源

好吧我真的不知道我在说什么所以请耐心听我说我正在使用 Theano 后端运行 Keras 以在 MNIST 图像上运行基本的神经网络目前只是一个教程过去我一直使用我的旧 HP 笔记本电脑因为我有 Windows 和 Ubunt
如何从 Dockerfile 安装 Python 3.7 和 Pip

我正在尝试构建基于 Ubuntu 18 04 的自定义 Docker 映像 Ubuntu 预装了 Python 3 6 但我想 1 安装 Python 3 7 2 将其设置为默认 Python 版本这样就可以使用python代替pytho
定义函数后对其进行修饰？

I think答案是否定的但我似乎找不到明确的说法我有以下情况 def decorated function function functools wraps function def my function print Hello s
如何在 Python 中将彩色输出打印到终端？

是否有与 Perl 等效的 Python 语言 print color red print
获取列表中倒数第二个元素[重复]

这个问题在这里已经有答案了我可以通过以下方式获取列表的倒数第二个元素 gt gt gt lst a b c d e f gt gt gt print lst len lst 2 e 有没有比使用更好的方法print lst len lst
Python 中的 @staticmethod 与 @classmethod

方法和方法有什么区别装饰的 https peps python org pep 0318 with staticmethod http docs python org library functions html staticmethod和
Django 在选择列表更改时创建毫无意义的迁移

我正在尝试使用可调用创建一个带有选择字段的模型以便 Django 在选择列表更改时不会创建迁移如中所述this https stackoverflow com questions 31788450 stop django from cr
select() 可以在 Windows 下使用 Python 中的文件吗？

我正在尝试在 Windows 下运行以下 python 服务器 An echo server that uses select to handle multiple clients at a time Entering any line o
Pandas Dataframe：将包含列表的行扩展到多行，并为所有列提供所需的索引

我在 pandas 数据框中有时间序列数据索引为测量开始时的时间列中包含以固定采样率记录的值列表连续索引列表中元素数量的差异这是它的样子 Time A B Z 0 1 2 3 4 1 2 3 4 2 5 6 7 8 5 6 7 8
将一个列表的元素除以另一个列表的元素

我有两个清单比如说 a 10 20 30 40 50 60 b 30 70 110 正如你所看到的列表 b 由一个列表的元素总和组成其中 window 2 b 0 a 0 a 1 10 20 30 etc 如何获得另一个列表该列表由
如何有效地从 loadmat 函数生成的嵌套 numpy 数组中提取值？

python中是否有更有效的方法从嵌套的python列表中提取数据例如A array array 12000000 dtype object 我一直在使用A 0 0 0 0 当你有很多像 A 这样的数据时这似乎不是一个有效的方法我也用
Airflow Python 单元测试？

我想为我们的 DAG 添加一些单元测试但找不到任何单元测试有 DAG 单元测试框架吗有一个端到端的测试框架存在但我猜它已经死了 https issues apache org jira browse AIRFLOW 79 https
在 matplotlib 中使用一组标量值对球体表面着色

我对 matplotlib 相当陌生这也是我的第一个问题我试图代表脑电图记录的头皮表面电位到目前为止我已经有了一个球体投影的二维图形它是使用轮廓生成的并且几乎可以归结为普通的热图有什么方法可以在半个球体上完成此操作吗即生成一
Flask WTForms 使用变量自动填充 StringField

我有一个表格我想用上一页收到的信息自动填充一些字段但如果他们想调整它它需要是可更改的我正在为我的 SelectField 使用动态创建的列表但添加 StringField 并不成功请参阅下面的我的代码 forms py clas
张量流：注册 numpy bfloat16 扩展

正如我所见 tensorflow 中有 bfloat16 的 numpy 扩展 https github com tensorflow tensorflow blob 24ffe9f729160a095a5cab8f592392018280
如何禁止 celery 中的 pickle 序列化

Celery 默认使用 pickle 作为任务的序列化方法如中所述FAQ http ask github com celery faq html isn t using pickle a security concern 这代表一个安全漏
如何将列表字典写入字符串而不是 CSV 文件？

This 堆栈溢出问题 https stackoverflow com questions 37997085 how to write a dictionary of lists to a csv file将列表字典写入 CSV 文件的答案
异步和协程与任务队列

我一直在阅读有关 python 3 中的 asyncio 模块的内容以及更广泛地了解 python 中的协程的内容但我不明白是什么让 asyncio 成为如此出色的工具我的感觉是你可以用协程做的所有事情通过使用基于多处理模块例如

随机推荐

Python Pandas：如何对组中的所有项目进行分组并为其分配 id？

我有 df domain orgid csyunshu com 108299 dshu com 108299 bbbdshu com 108299 cwakwakmrg com 121303 ckonkatsunet com 121303
使用嵌套的 hashmap 参数发送 volley 请求

我正在使用 android volley 框架向我的服务器发送 jsonobject 请求 get 请求工作正常现在我想发送一个带有请求参数的 post 请求该请求参数是嵌套的 hashmap 我重写 getparams 方法但它期望
从什么时候起 Xcode 不再需要前向方法声明，为什么？

我注意到 Xcode 或更准确地说是 Apple LLVM 编译器不再需要前向方法声明换句话说构建以下代码时不会发出警告 implementation Foo void foo self bar void bar end 这曾经发出警
Python、subprocess、call()、check_call 和 returncode 来查找命令是否存在

我已经弄清楚如何使用 call 让我的 python 脚本运行命令 import subprocess mycommandline lumberjack sleep all night work all day subprocess cal
Guid 应包含 32 位数字和 4 个破折号

我有一个包含 createuserwizard 控件的网站创建帐户后验证电子邮件及其验证 URL 将发送到用户的电子邮件地址但是当我进行测试运行时单击电子邮件中的 URL 时会出现以下错误 Guid should contain
生成的序列以 1 开头，而不是注释中设置的 1000

我想请求一些有关 Hibernate 创建的数据库序列的帮助我有这个注释下面的代码在我的实体类中以便为合作伙伴表提供单独的序列我希望序列以 1000 开头因为我在部署期间使用 import sql 将测试数据插入数据库并且我希
sharepoint：使用内容编辑器 Web 部件时发生此错误：“此时无法检索属性。”

我有一个内容编辑器 Web 部件每当我编辑内容然后单击保存时都会出现以下错误 Cannot retrieve properties at this time Cannot save your changes 你如何解决这个问题我尝试用
不显示 WRITE_EXTERNAL_STORAGE 的权限对话框

I want to download a file using DownloadManager And DownloadManager wants to WRITE EXTERNAL STORAGE permission I have in
迭代列表的奇怪速度差异

我创建了两个重复两个不同值的长列表在第一个列表中值交替出现在第二个列表中一个值出现在另一个值之前 a1 object object 10 6 a2 a1 2 a1 1 2 然后我迭代它们不对它们执行任何操作 for in a1 p
从 GitHub 上托管的 Spring Cloud Config Server 访问存储库的身份验证问题

我在 GitHub 上的存储库中托管配置如果我将回购公开一切都好但如果我将其设为私有我将面临 org eclipse jgit errors TransportException https github com my user m
如何在 Azure 数据工厂 - Databricks 中使用 continuation_token 获取 ADF Pipeline 运行详细信息的下一页？

我在用 adf client pipeline runs query by factory resourceGroupName 工厂名称过滤器参数的方法azure mgmt datafactory DataFactoryManageme
无符号和 std_logic_vector 之间的区别

谁能告诉我以下书面陈述之间的区别 signal A unsigned 3 downto 0 signal B std logic vector 3 downto 0 Both std logic vector and unsigned ar
使用 EF6 连接到 SQL Server

在 EF5 之前为了连接到 SQL Server 2012 我所需要做的就是指定一个如下所示的连接字符串 Data Source SqlExpress Initial Catalog MyDatabase Integrated secur
如何调用 google 的 getBasicProfile() 来仅单击按钮即可登录 google？

我在我的网站上使用谷歌登录
如何将 WPF 窗口置于前面？

我创建了一个单实例应用程序并且希望在用户多次启动该应用程序时激活已打开的窗口这工作正常但我有一个问题如果已经打开的窗口超出了另一个应用程序窗口我必须将其放在前面我尝试过 window Focus 和 window Show 但它
try-catch 中未处理的异常

try list from XElement e in d Descendants wix File where e Attribute Name Value Contains temp Name e Parent Parent Attri
了解 JavaScript - 资源

使用 StackOverflow 的微型 Digit Blog 功能进行描述here https stackoverflow com about 我想发布以下我刚刚看到的我觉得很有趣的谷歌技术谈话视频我一直在理解 javascript
在 Xcode4 中使用 Boost

有人设置 C Xcode4 项目来使用 Boost 吗对于一个简单的 C 控制台应用程序我需要在 Xcode 中设置哪些设置 Thanks 用这个来管理它和这个
找出哪些用户对邮箱具有完全访问权限

我试图绘制一个图表显示哪个 Exchange 用户对哪些 Exchange 邮箱拥有哪些权限并根据权限类型为它们着色截至目前我无法找到 Exchange 考虑的所有类型的权限我可以使用 EWS 找出用户自己授予谁访问邮箱的权限 f
Pandas 堆积条形图中元素的排序

我正在尝试绘制有关某个地区 5 个地区的家庭在特定行业赚取的收入比例的信息我使用 groupby 按地区对数据框中的信息进行排序 df df orig groupby District Portion of income value co

Pandas 堆积条形图中元素的排序

Pandas 堆积条形图中元素的排序 的相关文章

随机推荐

热门标签

Pandas 堆积条形图中元素的排序的相关文章