爬虫：json()数据解析（Request Method：GET）

2023-10-27

有一些网页会直接把所有的关键信息都放在HTML中请求，尤其是一些比较老（或比较轻量）的网站，我们用requests和BeautifulSoup就能解决它们；比如豆瓣。

而有些数据请求则通过Fetch/XHR传送，这些数据并不能直接在HTML页面中获取到，那么我们就需要用到Network功能：

1、Network功能简介

对请求进行分类，我们最常用的有以下：

夹在第2行和第1行中间的，是一个时间轴。记录什么时间，有哪些请求。

2、什么是Fetch/XHR？

在Network中有一类非常重要的请求叫做Fetch/XHR。

我们平时使用浏览器上网的时候，经常有这样的情况：浏览器上方，它所访问的网址没变，但是网页里却新加了内容。这个，叫做Ajax技术（应用这种技术，好处是显而易见的——更新网页内容，而不用重新加载整个网页，又省流量又省时间的）。

这种技术在工作的时候，会创建一个XHR（或是Fetch）对象，然后利用XHR对象来实现，服务器和浏览器之间传输数据。在这里，XHR和Fetch并没有本质区别，只是Fetch出现得比XHR更晚一些，但作用都是一样的。主要结构如下:

在General中有Request URL，使用该URL即可获取到通过Fetch/XHR发送的请求内容，但是获取到的内容是Str类型的字典/列表。

3、什么是json()

json是另一种组织数据的格式，长得和Python中的列表/字典非常相像。它和html一样，常用来做网络数据传输。刚刚我们在XHR里查看到的列表/字典，严格来说其实它不是列表/字典，它是json。

简单来说，在Python语言当中，json是一种特殊的字符串，这种字符串特殊在它的写法——它是用列表/字典的语法写成的。

或许你会有疑问：那直接写成列表/字典不就好了，为什么要把它表示成字符串？答案很简单，因为不是所有的编程语言都能读懂Python里的数据类型（如，列表/字符串），但是所有的编程语言，都支持文本（比如在Python中，用字符串这种数据类型来表示文本）这种最朴素的数据类型。

如此，json数据才能实现，跨平台，跨语言工作。

而json和XHR之间的关系：XHR用于传输数据，它能传输很多种数据，json是被传输的一种数据格式。就是这样而已。

4、如何解析json数据

我们可以将json格式的数据，转换成正常的列表/字典，也可以将列表/字典，转换成json。

①json格式转换成列表/字典

import requests

res = requests.get('http://……')
print(res.json())

②将列表/字典转换成json格式

import requests

a = {'姓名': '张三', '性别': '男'}
print(json.dumps(a))
print(type(a))

5、案例

import requests
# Fetch/XHR对象headers-General-Request URL
url = 'https://c.y.qq.com/splcloud/fcgi-bin/smartbox_new.fcg?_=1646270844314&cv=4747474&ct=24&format=json&inCharset=utf-8&outCharset=utf-8&notice=0&platform=yqq.json&needNewCode=1&uin=1152921504801487135&g_tk_new_20200303=2006272574&g_tk=2006272574&hostUin=0&is_xml=0&key=毛不易'
# 头信息
header = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.93 Safari/537.36'}
# 获取数据
res = requests.get(url, headers=header)
# 将json格式数据转换为字典/列表
res = res.json()
#从字典/列表中找到对应需要的数据
list_song = res['data']['song']['itemlist']
for song in list_song:
    print(song['name'])

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

爬虫：json()数据解析（Request Method：GET）的相关文章

如何使用固定的 pandas 数据框进行动态 matplotlib 绘图？

我有一个名为的数据框benchmark returns and strategy returns 两者具有相同的时间跨度我想找到一种方法以漂亮的动画风格绘制数据点以便它显示逐渐加载的所有点我知道有一个matplotlib animat
Pycharm Python 控制台不打印输出

我有一个从 Pycharm python 控制台调用的函数但没有显示输出 In 2 def problem1 6 for i in range 1 101 2 print i end In 3 problem1 6 In 4 另一方面像
如何收集列表、字典等中重复计算的结果（或制作修改每个元素的列表的副本）？

There are a great many existing Q A on Stack Overflow on this general theme but they are all either poor quality typical
DreamPie 不适用于 Python 3.2

我最喜欢的 Python shell 是DreamPie http dreampie sourceforge net 我想将它与 Python 3 2 一起使用我使用了添加解释器 DreamPie 应用程序并添加了 Python 3 2
SQL Alchemy 中的 NULL 安全不等式比较？

目前我知道如何表达 NULL 安全的唯一方法 SQL Alchemy 中的比较其中与 NULL 条目的比较计算结果为 True 而不是 NULL 是 or field None field value 有没有办法在 SQL Alchem
Spark的distinct()函数是否仅对每个分区中的不同元组进行洗牌

据我了解 distinct 哈希分区 RDD 来识别唯一键但它是否针对仅移动每个分区的不同元组进行了优化想象一个具有以下分区的 RDD 1 2 2 1 4 2 2 1 3 3 5 4 5 5 5 在此 RDD 上的不同键上所有重复键
Python tcl 未正确安装

我刚刚为 python 安装了graphics py 但是当我尝试运行以下代码时 from graphics import def main win GraphWin My Circle 100 100 c Circle Point 50
在 NumPy 中获取 ndarray 的索引和值

我有一个 ndarrayA任意维数N 我想创建一个数组B元组数组或列表其中第一个N每个元组中的元素是索引最后一个元素是该索引的值A 例如 A array 1 2 3 4 5 6 Then B 0 0 1 0 1 2 0 2 3 1 0
python 集合可以包含的值的数量是否有限制？

我正在尝试使用 python 设置作为 mysql 表中 ids 的过滤器 python集存储了所有要过滤的id 现在大约有30000个这个数字会随着时间的推移慢慢增长我担心python集的最大容量它可以包含的元素数量有限制吗您最大
Pandas Dataframe 中 bool 值的条件前向填充

问题如何转发 fill boolTruepandas 数据框中的值如果是当天的第一个条目 True 到一天结束时请参阅以下示例和所需的输出 Data import pandas as pd import numpy as np df
表达式中的 Python 'in' 关键字与 for 循环中的比较 [重复]

这个问题在这里已经有答案了我明白什么是in运算符在此代码中执行的操作 some list 1 2 3 4 5 print 2 in some list 我也明白i将采用此代码中列表的每个值 for i in 1 2 3 4 5 print
如何将 numpy.matrix 提高到非整数幂？

The 运算符为numpy matrix不支持非整数幂 gt gt gt m matrix 1 0 0 5 0 5 gt gt gt m 2 5 TypeError exponent must be an integer 我想要的是 oct
循环中断打破tqdm

下面的简单代码使用tqdm https github com tqdm tqdm在循环迭代时显示进度条 import tqdm for f in tqdm tqdm range 100000000 if f gt 100000000 4 b
Python - 按月对日期进行分组

这是一个简单的问题起初我认为很简单而忽略了它一个小时过去了我不太确定所以我有一个Python列表datetime对象我想用图表来表示它们 x 值是年份和月份 y 值是此列表中本月发生的日期对象的数量也许一个例子可以更好地证明这
在Python中重置生成器对象

我有一个由多个yield 返回的生成器对象准备调用该生成器是相当耗时的操作这就是为什么我想多次重复使用生成器 y FunctionWithYield for x in y print x here must be something t
Python：计算字典的重复值

我有一本字典如下 dictA unit1 test1 alpha unit1 test2 beta unit2 test1 alpha unit2 test2 gamma unit3 test1 delta unit3 test2 gamm
glpk.LPX 向后兼容性？

较新版本的glpk没有LPXapi 旧包需要它我如何使用旧包例如COBRA http opencobra sourceforge net openCOBRA Welcome html 与较新版本的glpk 注意COBRA适用于 MATL
如何使用google colab在jupyter笔记本中显示GIF？

我正在使用 google colab 想嵌入一个 gif 有谁知道如何做到这一点我正在使用下面的代码它并没有在笔记本中为 gif 制作动画我希望笔记本是交互式的这样人们就可以看到代码的动画效果而无需运行它我发现很多方法在 Goo
您可以在 Python 类型注释中指定方差吗？

你能发现下面代码中的错误吗米皮不能 from typing import Dict Any def add items d Dict str Any gt None d foo 5 d Dict str str add items d f
PyAudio ErrNo 输入溢出 -9981

我遇到了与用户相同的错误 Python 使用 Pyaudio 以 16000Hz 录制音频时出错 https stackoverflow com questions 12994981 python error audio recording

随机推荐

助推打造全球研发中心城市

阿里社招一面面不动了真的面不动了一项目挑一个你觉得最有挑战性的细说有些细节被质疑了嘴在前面飞脑子在后面追以后说每一句话都要小心笑cry 二八股1 聚簇索引和非题解检索产品名称和描述一 select prod nam
3D关键点检测（2020-2017)

3D关键点检测 1 3D关键点检测之PoseDRL Deep Reinforcement Learning for Active Human Pose Estimation AAAI2020 这篇文章可能与我们通常所处理的姿态估计任务略有不
【BEV】BEVDet

BEVDet 解析 BEVDet 模型 bevdet r50 训练配置 Scale NMS 优化配置推理记录注册随机种子总结 BEVDet BEVDet继承于CenterPoint gt MVTwoStageDetector 模型实
射频工程师笔记---射频通信基础

文章更新或问题可关注本人公众号回顾一下移动通信技术的发展其实是互联网和通信技术的融合过程在这个过程中很多应用都在不断加入其中比如计算机跟通信的融合产生了互联网互联网跟手机的融合带来了移动互联网手机可以看杂志看视频听音乐于
SpringCLoud——服务的拆分和远程调用

服务拆分服务拆分注意事项一般是根据功能的不同将不同的服务按照功能的不同而分开微服务拆分注意事项不同微服务不要重复开发相同业务微服务数据独立不要访问其他微服务的数据库微服务可以将自己的业务暴露为接口供其他微服务调用远程调
C++ 数据结构与算法（五）（哈希表）

哈希表 1 定义哈希表 Hash table 也称散列表是根据关键码的值而直接进行访问的数据结构一般哈希表都是用来快速判断一个元素是否出现集合里只需要在初始化时用哈希函数 hash function 将这些元素映射在哈希表的索引上
WJ的Direct3D简明教程2：Render-To-Texture

转载请注明来自http blog csdn net skyman 2001 Rendering to a texture is one of the advanced techniques in Direct3D On the one h
Unity绘制户型（一）

户型绘制主要对象数据点线面部件门窗主要难点是通过绘制的点寻找闭合多边形多边形的生成 3D墙体的生成门窗要在墙体上留下孔洞这四个功能这篇文章我只写前两个问题后面来两个问题单独再写一篇文章 1 如何寻找闭合多边形我的方法是
内容管理系统测试实战

使用django和restframework开发接口使用postman测试接口使用unittest和requests模块测试接口目录 Django安装 Django Rest Framework 创建API应用数据库迁移创建超级管
C++11中pair的用法

概述 pair可以将两个数据组合成一种数据类型 C 标准库中凡是必须返回两个值的函数都使用pair pair有两个成员变量分别是first和second 由于使用的struct而不是class 因此可以直接访问pair的成员变量基本用法
Python_某宝某东秒杀抢购

纯学习分享只用于学习用途请勿用于任何商业用途本人不承担任何责任视频编写过程某宝秒杀程序某宝源码 from selenium import webdriver from selenium webdriver common by i
springboot配置shiro多项目实现session共享的详细步骤

springboot配置shiro多项目实现session共享的详细步骤项目的配置步骤我已写到另一篇文章中 shiro框架多项目登录访问共享session的实现 springboot redis shiro 的实现项目已共享到GitHu
关于Tomcat端口被占用的情况

今天打开eclipse突然发现运行不了报错的提示为 Several ports 8005 8080 8009 required by Tomcat v7 0 Server at localhost are already in use 有
Android studio遇到问题:Emulator: PANIC: Cannot find AVD system path. Please define ANDROID_SDK_ROOT

前言在使用android studio时配置模拟器的时候一直在报错这个然后网上找到问题并实际解决了问题在这里记录下目录问题原因没有配置环境的情况下是因为他默认找的是这个路径的AVD 问题很明显了中文路径导致的 C Use
Vue路由传参几种方式

动态路由传参 path detail username name a component gt import components Detail vue
windows server 2012 安装gooderp

概述这是我安装的第一个erp系统为什么选择gooderp 因为它是开源的个人认为还是不错的一个erp系统 windows上安装完全是傻瓜式的安装介绍下环境我使用的是阿里云的windows server 2012 为了安全呢最好更新
前端浏览器常见兼容性问题及解决方案

目录 1 最常见的每个浏览器的默认margin padding大小都不同当设置定位时会有些许差异 2 图片默认有间距当几个img标签放到一起时有些浏览器会有默认间距加上第一条的设置的通配符样式也无用 3 min height问题
mc服务器查看死亡位置,我的世界查询死亡地点指令

发布时间 2016 06 01 很多朋友在玩我的世界这款游戏时总会有各种意外死亡发生今天蚕豆网小编带给大家的是我的世界死亡后怎么才能使东西不掉落的方法游戏中的设定死亡后你身上的物品会掉落在地上需要快速的捡回要不然东西就会消失那么
goto语句在工作当中的用法

前言 goto语句在C语言编程中是比较少用的在学习C语言时老师也告诉要少用有的甚至说别用后来再工作当中看到了前辈写的代码里用了goto语句顿时感到goto语句的精妙遂在此记录 goto语句能使用不过要慎用应为C语言的代码中大
爬虫：json()数据解析（Request Method：GET）

有一些网页会直接把所有的关键信息都放在HTML中请求尤其是一些比较老或比较轻量的网站我们用requests和BeautifulSoup就能解决它们比如豆瓣而有些数据请求则通过Fetch XHR传送这些数据并不能直接在HTML页

爬虫：json()数据解析（Request Method：GET）

爬虫：json()数据解析（Request Method：GET） 的相关文章

随机推荐

热门标签

爬虫：json()数据解析（Request Method：GET）的相关文章