小福利,数据可视化之常见图形的绘制

2023-10-31

大家好,我是天空之城,今天带来小福利,数据可视化之常见图形的绘制


# 读取'本(专)科'群体的数据
college_student_data = pd.read_csv('./工作/college_student_data.csv', encoding = 'utf-8')

# 查看college_student_data中'年龄'的最小值
college_student_data['年龄'].min()
# 查看college_student_data中'年龄'的最大值
college_student_data['年龄'].max()
# 查看college_student_data中'年龄'的平均值
college_student_data['年龄'].mean()
# 查看college_student_data中'年龄'的中位数
college_student_data['年龄'].median()

# 计算总体数据'行业'一列频率分布,并将结果赋值到profession变量
my_data=pd.read_csv('./数据分析/123.csv',encoding='utf-8')
profession = my_data['行业'].value_counts()/my_data['行业'].value_counts().sum()
# 查看profession
profession

学生           0.398739
IT/通讯/互联网    0.251851
银行/证券/保险业    0.200320
其他           0.098759
教育行业         0.031119
新闻/出版行业      0.019212
Name: 行业, dtype: float64

饼图
profession.plot(kind = 'pie', autopct = '%.2f%%',
                figsize = (7, 7), title = '行业频率分布图',
                label = '')

不过要注意的是,pandas库的plot()方法是基于matplotlib库开发的。


设置图像中文字体
from matplotlib import pyplot as plt
plt.rcParams['font.family'] = ['Source Han Sans CN']
 'Source Han Sans CN' 这个参数,这个参数代表的是系统自带的中文字体。
 
autopct:参数autopct的作用就是设置饼图中数据的显示格式。
我们把autopct参数设置为autopct='%.2f%%'就可以保留小数点后两位。这里是一个固定用法,需要你牢记。
接下来只要将autopct = '%.2f%%'参数添加至plot()方法就可以了。

figsize:参数figsize的作用就是调整可视化图表的大小,指定plot()方法生成图表的宽和高,单位为英寸。

我们可以将宽度、高度以元组的形式赋值给figsize参数,括号内第一个值为图表的宽度,第二个值为图表的高度。

title:参数title的作用就是设置图表的标题名,只需要将标题名称以字符串的形式赋值给title参数就可以为图表设置标题!

在这里,我们可以将title = '行业频率分布图'填入plot()方法。

但仔细一看,这张图上还是有一个很碍眼的列标签:行业。这一标签出现在可视化图表中并没有什么意义。
如果不想要在图像上出现标签名,可以直接传入一个空的字符串label = ''将列标签隐藏掉。








在这里插入图片描述

条形图

# 提取my_data中的'岗位'数据
position = my_data['岗位'].value_counts()/my_data['岗位'].value_counts().sum()
# 绘制'岗位'一列的频率分布饼图
position.plot(kind = 'bar', figsize = (13, 6), title = '岗位频率分布图')



在这里插入图片描述

直方图
直方图,是可以用来描绘数值型数据频数分布或频率分布的图表。下面就是年龄一列的频数分布图。

直方图和条形图之间,最明显的区别就是,直方图的 “柱” 之间,是没有空隙的,而条形图的 “柱” 之间会有空隙。

直方图的 “柱” 之间之所以没有空隙,因为数值型数据是连续的,没有空隙恰好能体现出其连续性。

从年龄这列的频数分布直方图中我们可以很直观地看到,本(专)科学生年龄集中在18岁到19岁之间。


# 读取'本(专)科'学生中'年龄'这一列的数据
age = college_student['年龄']
# 绘制'年龄'这列的频率分布直方图
age.plot(kind = 'hist', bins = [17, 18, 19, 20, 21, 22, 23], figsize = (4, 5),
         title = '本(专)科学生年龄分布直方图', grid = True)



在这里插入图片描述

像我们这里的年龄数据可以被分成6组,分别是:[17, 18)、[18, 19)、[19, 20)、[20, 21)、[21, 22) 以及 [22, 23)。

这六个区间分别对应了六个年龄,分别是:17岁、18岁、19岁、20岁、21岁 以及 22岁。
这样,我们只需要将这6个区间的分隔点传给参数bins就可以了。

在这个例子中,就是bins = [17, 18, 19, 20, 21, 22, 23]。


数据分析报告样例
分析背景与目的
我们需要在数据分析报告的开始交代清楚这次数据分析的背景、目的。

不要觉得这一步很麻烦,你要记住你的数据分析报告是面向所有人的,因此你必须将背景与目的阐述清楚,让所有人都能快速了解你的数据分析项目。

分析思路
接下来,我们需要在介绍完分析背景与目的后,说明分析思路。
然后就到了报告的主体部分,在这里我们需要将数据来源、预处理过程、分析过程以及分析结果说明清楚。

数据来源
数据来源这部分,我们需要解释清楚数据的来源并简单展示一下数据。这里我们可以配上前五行数据的截图。

数据分析
数据分析这部分,我们需要展示分析结果并且配上今天得到的可视化图表,让分析结果更直观地呈现出来。

结论
主体部分完成后,我们需要对数据分析的结果进行一个总结。这里我们可以直接复用之前得到的结论:

附录
最后,我们可以在附录部分附上我们的源数据以及分析代码,为你的数据分析项目提供补充说明。

在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

小福利,数据可视化之常见图形的绘制 的相关文章

  • 使用 psycopg2 在 python 中执行查询时出现“编程错误:语法错误位于或附近”

    我正在运行 Python v 2 7 和 psycopg2 v 2 5 我有一个 postgresql 数据库函数 它将 SQL 查询作为文本字段返回 我使用以下代码来调用该函数并从文本字段中提取查询 cur2 execute SELECT
  • Python 中的 Lanczos 插值与 2D 图像

    我尝试重新缩放 2D 图像 灰度 图像大小为 256x256 所需输出为 224x224 像素值范围从 0 到 1300 我尝试了两种使用 Lanczos 插值来重新调整它们的方法 首先使用PIL图像 import numpy as np
  • 在 python 程序中合并第三方库的最佳实践是什么?

    下午好 我正在为我的工作编写一个中小型Python程序 该任务需要我使用 Excel 库xlwt and xlrd 以及一个用于查询 Oracle 数据库的库 称为CX Oracle 我正在通过版本控制系统 即CVS 开发该项目 我想知道围
  • Django 管理员在模型编辑时间歇性返回 404

    我们使用 Django Admin 来维护导出到我们的一些站点的一些数据 有时 当单击标准更改列表视图来获取模型编辑表单而不是路由到正确的页面时 我们会得到 Django 404 页面 模板 它是偶尔发生的 我们可以通过重新加载三次来重现它
  • 将 saxon 与 python 结合使用

    我需要使用 python 处理 XSLT 目前我正在使用仅支持 XSLT 1 的 lxml 现在我需要处理 XSLT 2 有没有办法将 saxon XSLT 处理器与 python 一起使用 有两种可能的方法 设置一个 HTTP 服务 接受
  • 如何在flask中使用g.user全局

    据我了解 Flask 中的 g 变量 它应该为我提供一个全局位置来存储数据 例如登录后保存当前用户 它是否正确 我希望我的导航在登录后在整个网站上显示我的用户名 我的观点包含 from Flask import g among other
  • Django:按钮链接

    我是一名 Django 新手用户 尝试创建一个按钮 单击该按钮会链接到我网站中的另一个页面 我尝试了一些不同的例子 但似乎没有一个对我有用 举个例子 为什么这不起作用
  • 从字符串中删除识别的日期

    作为输入 我有几个包含不同格式日期的字符串 例如 彼得在16 45 我的生日是1990年7月8日 On 7 月 11 日星期六我会回家 I use dateutil parser parse识别字符串中的日期 在下一步中 我想从字符串中删除
  • PyUSB 1.0:NotImplementedError:此平台不支持或未实现操作

    我刚刚开始使用 pyusb 基本上我正在玩示例代码here https github com walac pyusb blob master docs tutorial rst 我使用的是 Windows 7 64 位 并从以下地址下载 z
  • 如何替换 pandas 数据框列中的重音符号

    我有一个数据框dataSwiss其中包含瑞士城市的信息 我想用普通字母替换带有重音符号的字母 这就是我正在做的 dataSwiss Municipality dataSwiss Municipality str encode utf 8 d
  • 如何从网页中嵌入的 Tableau 图表中抓取工具提示值

    我试图弄清楚是否有一种方法以及如何使用 python 从网页中的 Tableau 嵌入图形中抓取工具提示值 以下是当用户将鼠标悬停在条形上时带有工具提示的图表示例 我从要从中抓取的原始网页中获取了此网址 https covid19 colo
  • OpenCV 无法从 MacBook Pro iSight 捕获

    几天后 我无法再从 opencv 应用程序内部打开我的 iSight 相机 cap cv2 VideoCapture 0 返回 并且cap isOpened 回报true 然而 cap grab 刚刚返回false 有任何想法吗 示例代码
  • 无法在 Python 3 中导入 cProfile

    我试图将 cProfile 模块导入 Python 3 3 0 但出现以下错误 Traceback most recent call last File
  • 使用 \r 并打印一些文本后如何清除控制台中的一行?

    对于我当前的项目 有一些代码很慢并且我无法使其更快 为了获得一些关于已完成 必须完成多少的反馈 我创建了一个进度片段 您可以在下面看到 当你看到最后一行时 sys stdout write r100 80 n I use 80覆盖最终剩余的
  • Fabric env.roledefs 未按预期运行

    On the 面料网站 http docs fabfile org en 1 10 usage execution html 给出这个例子 from fabric api import env env roledefs web hosts
  • 向 Altair 图表添加背景实心填充

    I like Altair a lot for making graphs in Python As a tribute I wanted to regenerate the Economist graph s in Mistakes we
  • 对年龄列进行分组/分类

    我有一个数据框说df有一个柱子 Ages gt gt gt df Age 0 22 1 38 2 26 3 35 4 35 5 1 6 54 我想对这个年龄段进行分组并创建一个像这样的新专栏 If age gt 0 age lt 2 the
  • 有没有办法检测正在运行的代码是否正在上下文管理器内执行?

    正如标题所述 有没有办法做到这样的事情 def call back if called inside context print running in context else print called outside context 这将
  • 发送用户注册密码,django-allauth

    我在 django 应用程序上使用 django alluth 进行身份验证 注册 我需要创建一个自定义注册表单 其中只有一个字段 电子邮件 密码将在服务器上生成 这是我创建的表格 from django import forms from
  • Python Selenium:如何在文本文件中打印网站上的值?

    我正在尝试编写一个脚本 该脚本将从 tulsaspca org 网站获取以下 6 个值并将其打印在 txt 文件中 最终输出应该是 905 4896 7105 23194 1004 42000 放置的动物 的 HTML span class

随机推荐

  • Latex插入参考文献的两种方法—自动与手动

    先忍不住吐槽一下 为啥都21世纪了还有期刊要求参考文献要放在 tex文件里面 使用 bib文件多简洁优美啊 现在我们就来看下latex中插入参考文献的两种方法 第一种 自动方法 使用 bib文件 在主文件 tex的同级目录下创建exampl
  • 6、服务数据的定义和使用

    一 服务数据模型 二 具体实现步骤 1 首先现在功能包中创建一个srv的文件夹 然后在改文件夹下新建一个以 srv为后缀的文件 所举例的该文件的具体内容如下 string name uint8 age uint8 sex uint8 unk
  • 2023最新版Anaconda下载安装教程(非常详细)从零基础入门到精通,看完这一篇就够了

    1 前言 小编的电脑是win10系统的 这里以win10系统安装Anaconda为例 其他的系统安装过程类似 可以照猫画虎 下面请看具体的安装过程 2 下载软件 1 首先去官网上进行下载软件 下载地址 https docs anaconda
  • 专访雅虎刷题狂人曹鹏:10年理论与实践结合的程序员之路

    采访联络员 SophyJ 作者 ly行云流水 所属机构 CSDN高校俱乐部 高校发布地址 http student csdn net mcd topic 163587 941331 摘要 在曹鹏博士的采访过程中 他最长提起的便是感恩 感谢良
  • Floyd算法的原理和实现代码

    原理 假设有向图G V E 采用邻接矩阵存储 设置一个二维数组A用于存放当前顶点之间的最短路径长度 分量A i j 表示当前顶点i gt j的最短路径长度 然后 每次添加一个顶点 同时对A的数组进行筛选优化 期间会产生k个A数组 Ak i
  • 第一个vue程序

    div message h2 school name school moblie h2 div
  • 程序、进程、线程联系以及进程和线程的区别和联系

    程序和进程的区别与联系 程序是一组有序的指令集合是一个静态的概念 一个程序由一组指令组成 以二进制方式存在存储器中 进程是程序及其数据在计算机上的一次运行活动 是一个动态的概念 进程的运行实体是程序 离开的程序的进程没有意义 进程是由程序
  • 交互原型设计工具

    1 axure RP 适合 快速创建应用软件或Web线框图 流程图 原型和规格说明文档 优点 支持交互设计 并可生成规格说明文档和输出HTML原型 Axure RP 集 UX 原型 规范和图表于一身 2 Sketch 适合 为视觉设计师打造
  • 图数据库——大数据时代的高铁

    作者 董小珊 姚臻 责编 仲培艺 zhongpy csdn net 本文为 程序员 原创文章 未经允许不得转载 更多精彩文章请订阅 程序员 如果把传统关系型数据库比做火车的话 那么到现在大数据时代 图数据库可比做高铁 它已成为NoSQL中关
  • IDEA鼠标右击new没有class和interface的解决办法

    IDEA点击new没有class和interface 问题如下图 解决办法 1 File gt Project Structure 如下图所示 2 选择Modules gt 右边Sources中选择所需目录 然后点击 Sources gt
  • 云平台的技术

    约束记录表 简朴 勤劳 谦虚 诚恳 禁止浪费 珍惜时间 虚心学习 纯心做人 1 0 1 1 节制 静默 条理 决断 不恋吃睡 开口有益 规整事务 坚持 迅捷 0 1 1 1 正直 中庸 整洁 宁静 贞洁 敬业负责 不倚势凌人 外表整洁 不纠
  • 【解决】windows安装pycrypto出错问题。error C2061: 语法错误: 标识符“intmax_t”

    1 执行命令报错 pip install pycrypto Installing collected packages pycrypto Running setup py install for pycrypto error ERROR C
  • easyUI Tree树动态刷新子节点

    tree tree url xxx 默认是post请求 checkbox false animate true lines true loadFilter function rows 返回要显示的过滤数据 返回数据时以标准树格式返回的 也就
  • MongodbTemplate 批量更新或者修改

    批量更新或者修改 public void saveOnlineStatusList List
  • 线性反馈移位寄存器 LFSR

    参考连接 添加链接描述 运算基础 模2运算 线性反馈移位寄存器用于产生可重复的伪随机序列PRBS 该电路由n级除法器和异或门组成 在k阶段 寄存器存在初值 Rn 1 R1 R0 称为seed 在k 1阶段 寄存器的值变为 k 1阶段 Rn
  • word2010或以上版本编号变成黑块的正确处理方

    打开编号显示为黑块的文档 把光标放置在黑块的后面 然后在键盘上按左方向键 则黑块变灰色 为选中状态 2 然后按下ctrl shift s 出现应用样式窗口点击 重新应用 黑块显示成正常的编号 3 然后点击 多级列表 按钮 选择 定义新的多级
  • 一次数据库的选型,FireBird胜出

    做了n多年的J2EE应用以后 如何做客户端的BI确实让我一下子摸不到门路 近期的一个客户要求我们给他做基于客户端的BI分析 客户是对外提供重要数据的单位 有很多的客户每年购买他的数据 可以说人家的数据库 每行每列都是钱 在这种情况下 他们非
  • css实现文字环绕图片布局

    前言 css实现文字环绕图片的效果 实现效果 实现代码 通过图片属性 align div style width 400px img src d303 paixin com thumbs 3548553 231637502 staff 10
  • 数据结构——AVL树

    目录 1 什么是AVL树 2 AVL树插入的模拟实现 节点定义 插入 旋转 右单旋 左单旋 双旋 右左旋 双旋 左右旋 完整的插入代码 3 AVL树的性能分析 1 什么是AVL树 AVL树是一种自平衡二叉查找树 也被称为高度平衡树 它具有以
  • 小福利,数据可视化之常见图形的绘制

    大家好 我是天空之城 今天带来小福利 数据可视化之常见图形的绘制 读取 本 专 科 群体的数据 college student data pd read csv 工作 college student data csv encoding ut