使用Python爬虫和数据可视化，揭示人口大国历年人数的变迁

2023-11-16

前言

人口大国通常在全球人口排名中位居前列，其人口数量远远超过其他国家。而印度和中国这两个国家的人口数量均已经超过14亿，而当前全球的人口总数也不过刚刚突破80亿而已，妥妥的天花板级别存在。或许是中国和印度在人口方面的表现太过“耀眼”，以至于后面的那些人口大国遭到了忽视。

这次就获取7个人口大国从1960~2021年的人口数据，做一个简单的数据可视化展示

获取各国历年人口数据

这次的数据，先百度xx国人口，数据就有了，比如美国的。既然找到数据，那剩下的就好办了

导入模块

import requests
import re
import csv
import json

七国人口数据url

url_list = {
    'https://wap.ceidata.cei.cn/detail?id=4HPs5PzbdUU%3D': '巴基斯坦',
    'https://wap.ceidata.cei.cn/detail?id=qZzzwDe0Dqo%3D': '墨西哥',
    'https://wap.ceidata.cei.cn/detail?id=YJPExELnyz4%3D': '俄罗斯',
    'https://wap.ceidata.cei.cn/detail?id=IK9os%2FE3qus%3D': '巴西',
    'https://wap.ceidata.cei.cn/detail?id=lcQfPi1wriY%3D': '印度',
    'https://wap.ceidata.cei.cn/detail?id=YLwIVWo8jdk%3D': '美国',
    'https://wap.ceidata.cei.cn/detail?id=cfXaPuej8ZY%3D': '中国',
}

获取数据

# for url, name in url_list.items():
url = 'https://wap.ceidata.cei.cn/detail?id=cfXaPuej8ZY%3D'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36'
}
response = requests.get(url, headers=headers)
html_data = re.findall('"innerTime":"(\d+)","data":"(.*?)"', response.text)
# json_data = json.loads(html_data)
if len(html_data) == 74:
    html_data = html_data[11:-1]
for date, num in html_data:
    num = float(num) // 100
    dit = {
        '年份': date,
        '人数': num
    }
    print(dit)

保存数据

f = open(f'{name}.csv', mode='w', encoding='utf-8', newline='')
csv_writer = csv.DictWriter(f, fieldnames=['年份', '人数'])
csv_writer.writeheader()

根据实际需求，你可能需要对提取的数据进行一些处理，如清洗、转换格式等。然后，可以使用适当的方法将数据保存到文件（如CSV、JSON等）或存储到数据库中。

可视化

导入数据

df = pd.read_csv('中国.csv')
df_1 = pd.read_csv('印度.csv')
df_2 = pd.read_csv('美国.csv')
df_3 = pd.read_csv('巴西.csv')
df_4 = pd.read_csv('俄罗斯.csv')
df_5 = pd.read_csv('墨西哥.csv')
df_6 = pd.read_csv('巴基斯坦.csv')

1960-2021年人口变化

from pyecharts import options as opts
from pyecharts.charts import Bar, Timeline
from pyecharts.faker import Faker
country_list = ['中国', '印度', '美国', '巴西', '俄罗斯', '墨西哥', '巴基斯坦']
# country_list = [ '印度', '美国', '巴西', '俄罗斯', '墨西哥', '巴基斯坦']
tl = Timeline()
date_list = [j for j in range(1960, 2022)]
for i, num in zip(date_list, num_list):
    bar = (
        Bar()
        .add_xaxis(country_list)
        .add_yaxis("人口/百万", num, label_opts=opts.LabelOpts(position="right"))
#         .add_yaxis("印度", list_1, label_opts=opts.LabelOpts(position="right"))
#         .add_yaxis("美国", list_2, label_opts=opts.LabelOpts(position="right"))
#         .add_yaxis("巴西", list_3, label_opts=opts.LabelOpts(position="right"))
#         .add_yaxis("俄罗斯", list_4, label_opts=opts.LabelOpts(position="right"))
#         .add_yaxis("墨西哥", list_5, label_opts=opts.LabelOpts(position="right"))
#         .add_yaxis("巴基斯坦", list_6, label_opts=opts.LabelOpts(position="right"))
        .reversal_axis()
        .set_global_opts(
            title_opts=opts.TitleOpts("1960-2021年人口变化 (时间: {} 年)".format(i)),
#             yaxis_opts=opts.AxisOpts(max_=1500)
        )
    )
    tl.add(bar, "{}年".format(i))
tl.render_notebook()

对比的几个人口大国的数据，中国和印度是目前世界上人口数量最多的两个国家。在这段时间内，中国的人口总量从约6.67亿人增加到约14.12亿人，增长了近一倍。印度的人口总量从约4.46亿人增加到约14.08亿人，增长了约3倍。

其中最为稳定的就是俄罗斯了

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

爬虫

信息可视化

使用Python爬虫和数据可视化，揭示人口大国历年人数的变迁的相关文章

Python Pandas 滚动聚合一列列表

我有一个简单的数据框 df 和一列列表lists 我想根据以下内容生成一个附加列lists The df好像 import pandas as pd lists 1 1 2 1 2 3 3 2 9 7 9 4 2 7 3 5 create

熊猫按 n 最大总和分组

我正在尝试使用groupby nlargest and sum在 Pandas 中一起运行但在运行时遇到困难 State County Population Alabama a 100 Alabama b 50 Alabama c 40

Flask-SocketIO redis 订阅

我在用着https github com miguelgrinberg Flask SocketIO https github com miguelgrinberg Flask SocketIO实现 WebSocket 服务器我需要从另一

docker 容器中的“（pygame parachute）分段错误”

尝试在 docker 容器中使用 pygame 时出现以下错误我想从容器中获取显示 Fatal Python error pygame parachute Segmentation Fault 重现 Docker已安装 docker ru

如何替换Python字符串中的正确字母

任务是您的任务是纠正数字化文本中的错误您只需处理以下错误 S 被误解为 5 O 被误解为 0 I 被误解为 1 我的代码 def correct string for i in string if 5 in string string

pyCUDA无法打印结果

最近我使用 pip 为我的 python3 4 3 安装 pyCUDA 但我在测试示例代码时发现 https documen tician de pycuda tutorial html getting started https doc

Python 不考虑 distutils.cfg

我已经尝试了给出的所有内容并且所有教程都指向相同的方向即使用 mingw 作为 python 而不是 Visual C 中的编译器我确实有 Visual C 和 mingw 当我想使用 pip 安装时问题开始出现它总是给Unabl

获取 Keras model.summary() 作为表

我在 Keras 中创建了相当大的模型我正在用 LaTeX 写一篇关于它的文章为了很好地描述 LaTeX 中的 keras 模型我想用它创建一个 LaTeX 表我可以手动实现它但我想知道是否有任何更好的方法来实现这一点我四处

Pandas 字典键到列[重复]

这个问题在这里已经有答案了我有一个像这样的数据框 index column1 e1 u c680 5 u c681 1 u c682 2 u c57 e2 u c680 6 u c681 2 u c682 1 u c57 e3 u c68

pandas groupby 操作缺少数据

在 pandas 数据框中我有一列如下所示 0 M 1 E 2 L 3 M 1 4 M 2 5 M 3 6 E 1 7 E 2 8 E 3 9 E 4 10 L 1 11 L 2 12 M 1 a 13 M 1 b 14 M 1 c 15

Python：导入模块一次然后与多个文件共享

我有如下文件 file1 py file2 py file3 py 假设这三个都使用 lib7 py lib8 py lib9 py 目前这三个文件中的每一个都有以下行 import lib7 import lib8 import lib

如何通过selenium中弹出的身份验证？

我正在尝试使用带有 Selenium 的 Python 脚本加载需要身份验证的网页 options webdriver ChromeOptions prefs download default directory r download de

获取多个同名请求参数

我的问题是给定的代码 from flask import Flask request app Flask name app route def hello return str request values get param None a

AttributeError: 'super' 对象没有属性 '__getattr__' 在 Kivy 中使用带有多个 kv 文件的 BoxLayout 时出错

我很清楚这个问题已经被问过好几次了但尝试以下解决方案后 Python Kivy AttributeError 尝试获取 self ids 时 super 对象没有属性 getattr https stackoverflow com qu

如何在引发异常时将变量传递给异常并在异常时检索它？

现在我只有一个空白的异常类我想知道如何在引发变量时给它一个变量然后在 try except 中处理它时检索该变量 class ExampleException Exception pass 为其构造函数提供一个参数将其存储为属性然后

为什么从 openAI 导入 Universe 模块时出现“无效语法”错误

当我导入时universe来自 openAI 的模块我收到以下错误 Traceback most recent call last File

检查 IP 地址是否在给定范围内

我想检查一下是否有IP180 179 77 11位于特定范围之间例如180 179 0 0 180 179 255 255 我编写了一个函数它将每个 IP 八位字节与其他八位字节进行比较 def match mask IP min ip

如何有效地比较 pandas DataFrame 中的行？

我有一个 pandas 数据框其中包含雷击记录以及时间戳和全球位置格式如下 Index Date Time Lat Lon Good fix 0 1 20160101 00 00 00 9962692 7 1961 60 7604 1

从 Django 运行 shell 命令

我正在 Django 中开发一个网页使用 apache 服务器需要调用 shell 命令来启用禁用一些守护进程我尝试这样做 os system service httpd restart 1 gt HOME out 2 gt HOM

超过两个点的Python相对导入

是否可以使用路径中包含两个以上点的模块引用就像这个例子一样 Project structure sound init py codecs init py echo init py nix init py way1 py way2 py w

随机推荐

在Windows服务器上搭建Nuget私人服务器(超~详细)

在Windows服务器上搭建Nuget私人服务器一使用VS2017 VS2019新建空白解决方案操作如图步骤一这里以VS2019为例打开VS2019 选择创建新项目选项步骤二选择空白解决方案点击下一步步骤三填写

React中setState()更新状态的两种写法及相关问题

1 setState updater callback 函数式的setState updater是一个返回stateChange对象的函数如下代码所示它接收的state和props都保证为最新 updater的返回值会与state进行浅

关于Socket编程中的inet_ntop、inet_pton和inet_ntoa、inet_addr

VS2013中调试Socket代码时遇到了点小问题问题代码为 cpp view plain copy inet ntoa addrClient sin addr 生成错误消息为 plain view plain copy error C

Spark中的基本概念

Spark中的基本概念 1 基本概念 1 1 RDD 弹性分布式数据集 1 2 DAG 有向无环图 1 3 Partition 数据分区 1 4 NarrowDependency 窄依赖 1 5 ShuffleDependency 宽依赖

互斥锁，自旋锁，原子操作的原理，区别和实现

一互斥锁原理互斥锁属于sleep waiting类型的锁例如在一个双核的机器上有两个线程线程A和线程B 它们分别运行在Core0和Core1上假设线程A想要通过pthread mutex lock操作去得到一个临界区的锁而此时

windows系统软件开发平台配置

1 mongodb安装及配置参考文档 https blog csdn net xuforeverlove article details 88344213 1 1 临时启动mongodb服务 a 打开mongodb安装文件夹进入并复制d

【七夕活动精选】致你的七夕礼物——3D Heart，跳动的 3D 爱心

程序效果很简单是一颗跳动的爱心在心脏下面有一行小字写着七夕快乐按住鼠标左键并拖动可以让它旋转起来按住右键可以让这颗心暂时停止跳动执行效果如下完整的源代码如下程序名称致你的七夕礼物 3D Heart 编译环境 Visual

sqli-labs 41——65关攻略

Less 41 基于错误的POST型单引号字符型注入与之前讲的Less 40的区别 s q l S E L E C T F R O M u s e r s W H E R E i d sql SELECT FROM users WHERE

2023年华中杯选题人数公布

2023年华中杯选题人数公布经过一晚上代码的编写论文的写作 C题完整版论文已经发布注蓝色字体为说明备注解释字体不能出现在大家的论文里黑色字体为论文部分大家可以根据红色字体的注记进行摘抄对应的详细的写作视频教程争取1号晚上发

[机器学习笔记] 支持向量机SVM 和逻辑回归LR的异同

参考 https www cnblogs com zhizhan p 5038747 html 为什么把SVM和LR放在一起进行比较一是因为这两个模型应用广泛二是因为这两个模型有很多相同点在使用时容易混淆不知道用哪个好特别是对初学

性能测试-压力测试-jmeter简单实战

文章目录一压力测试 1 性能指标响应时间 RT HPS Hits Per second TPS Transaction Per second QPS Query Per second 最大响应时间 Max Response Time

oracle如何提高数据库的性能和可用性

进行数据库优化通过定期执行优化操作如维护索引调整内存参数优化 SQL 语句等可以提高数据库的性能和可用性执行数据库碎片整理通过执行表空间碎片整理索引碎片整理表碎片整理等操作可以优化数据库的碎片提高数据存储效率执行数据

ruoyi对数据二次处理后分页失效

业务场景正常业务场景下在service层只做一次查询就能满足需求若需要分页只需在Controller层添加继承BaseController 使用startPage 和getDataTable 即可业务需求存在需要对查询的数据做二次

SpringCloud 服务保护机制Hystrix

微服务高可用技术大型复杂的分布式系统中高可用相关的技术架构非常重要高可用架构非常重要的一个环节就是如何将分布式系统中的各个服务打造成高可用的服务从而足以应对分布式系统环境中的各种各样的问题避免整个分布式系统被某个服务的故障给拖垮

Unity中的C#与C++交互

参考 Unity Manual Low level Native Plugin Interface 源码demo 演示了一个渲染三角形的例子 C 部分代码实现了对底层API的封装以及核心功能实现 RenderingPlugin cpp中定义

记一次Gradle构建项目Cannot locate tasks that match ‘:xxxx‘ as task ‘xxx‘ not found in root project ‘xxxx‘错误

问题在使用Gradle构建项目时遇见了一个奇怪的问题运行报错如下 Cannot locate tasks that match xxxx as task xxx not found in root project xxxx 思路单看

Linux基础学习笔记之——软件安装：源码与Tarball

软件安装源码与Tarball 1 开放源码的软件安装与升级简介 Linux 上面的软件几乎都是经过 GPL 的授权所以每个软件几乎均提供源码并且你可以自行修改该程序代码以符合个人的需求这就是开放源码的优点 1 1 什么是开放源码

腾讯事务处理技术验证系统3TS-Coo模板安装文档&&说明文档（小白向，简单轻松就能上手）

本篇文章将详细说明3TS Coo模板的安装和使用帮助您快速上手项目第一部分是简单的基础Docker相关概念精炼的几句小白话快速理解即可第二部分是快速安装项目环境的安装文档简单几行命令搞定小白也能轻松上手第三部分是对于已经安装的

jupter notebook代码无法执行，出现in[*]的解决办法

In 数字代表已经执行的代码其中数字代表可执行的代码编号解决办法点击Kernel中的Restart Run all 重新执行全部代码系统会从In 1 依次执行并且报错我们一直改错即可直至In 变为In 数字即可

使用Python爬虫和数据可视化，揭示人口大国历年人数的变迁

前言人口大国通常在全球人口排名中位居前列其人口数量远远超过其他国家而印度和中国这两个国家的人口数量均已经超过14亿而当前全球的人口总数也不过刚刚突破80亿而已妥妥的天花板级别存在或许是中国和印度在人口方面的表现太过耀眼以至于

热门标签

后氧传感器正常数据

返回引用和指针

返回数组

返回类型

合并相同内容单元格

ETL教程

软考真题

formhtml插件

Arnold变换

服务器动态文档

超分辨率实验

个人学习总结

倒排索引

OneOS技术分享

java输入输出流

java输入输出

java输入

使用Python爬虫和数据可视化，揭示人口大国历年人数的变迁

前言

获取各国历年人口数据

导入模块

七国人口数据url

获取数据

保存数据

可视化

导入数据

1960-2021年人口变化

使用Python爬虫和数据可视化，揭示人口大国历年人数的变迁 的相关文章

随机推荐

热门标签

使用Python爬虫和数据可视化，揭示人口大国历年人数的变迁的相关文章