Python爬虫---王者荣耀(最详细)

2023-05-16

Python爬虫—王者荣耀(最详细)

首先来到王者荣耀的首页
在这里插入图片描述
点击游戏壁纸进去，就会看到这些图片，大致看了一下，是我们想要的东西
点开图片看看能不能找到什么规律

可以看见每张图下面都有六个分辨率的选项，我们点两个进去看看

19201080的点开，图片很清晰。我们再点一个其他分辨率的

这个是1024768的

我们来看一下url的区别在哪里

1920*1080的url：http://shp.qpic.cn/ishow/2735120117/1606814547_84828260_690_sProdImgNo_6.jpg/0

1024*768的url：http://shp.qpic.cn/ishow/2735120117/1606814546_84828260_690_sProdImgNo_2.jpg/0

其实不难看出，区别在于一个是sProdImgNo_6另一个是sProdImgNo_2

那么他们有什么规律呢？
我们再回去看一下网页
在这里插入图片描述

19201080的位置是第五个
1024768的位置是第一个

sProdImgNo_6在5的位置上
sProdImgNo_2在1的位置上
那么？sProdImgNo_1是什么东西呢？我们去看看

在这里插入图片描述
sProdImgNo_1也是一张图，不过分辨率更小了，这样就有个规律了

不过一张是远远不够的，我们要全部图片的规律和链接

既然找到了东西，我们就可以开分析一下网页了，来找找数据源在哪里，按F12

在这里插入图片描述
经过一番的查找，我们可以看到这个文件中有一堆json数据，且很像存放图片的地方

在这里插入图片描述
复制这个链接，我们打开看看

看到的应该是这样的
在这里插入图片描述
一堆不知名的东西，很头疼
但是你可以安装一个浏览器插件，来让它变得更“好看”
它的名字就是 JSON-handle

安装好之后，你再打开网页就是这样的了
在这里插入图片描述
是不是就好看多了，看起来也更加清晰了

但是你会发现还是一堆乱七八糟的

为什么呢？因为它用了UrlEncode编码

不过我们有办法让它解码，让我们看得懂它
在这里插入图片描述
先随便点一个乱码，然后单击右上角的deURL，就变成我们可以看懂的了

逐一去看看，发现的确是我们要的东西，而且这次就不=只是一张图的链接了，是一页的数据，都在里面
在这里插入图片描述
当你的数据找到位置了，现在差不多就可以开始写代码了

import re
import time
import requests
# url编码和解码
from urllib import parse
import threading

headers = {
	# 自行添加
    'cookie':'',
    'user-agent':'',
}
start = time.time()
try:
    count = 0
    countPage = 23
    for page in range(0, countPage):
        url = 'https://apps.game.qq.com/cgi-bin/ams/module/ishow/V1.0/query/workList_inc.cgi?activityId=2735&sVerifyCode=ABCD&sDataType=JSON&iListNum=20&totalpage=0&page={0}&iOrder=0&iSortNumClose=1&jsoncallback=jQuery171049106997163594523_1606960309787&iAMSActivityId=51991&_everyRead=true&iTypeId=2&iFlowId=267733&iActId=2735&iModuleId=2735&_=1606960310077'.format(
            page)
        response  =requests.get(url, headers=headers, timeout= 3)
        if response.status_code == 200:
            html = response.text
        # print(html)

        # 正则解析数据
        nameList = re.findall(r'"sProdName":(.*?),', html)
        urlList = re.findall(r'"sProdImgNo_6":(.*?),', html)
        # 循环读取总页数
        if page == 1:
            cPage = re.findall(r'"iTotalPages":(.*?),', html)
            cPage = ''.join(cPage).replace('"','')
            countPage = int(cPage)
        print('\n第{0}页\n'.format(page+1))
        for name, url in zip(nameList, urlList):
            # 解码、格式化
            name = parse.unquote(name).replace('"', '')
            url = parse.unquote(url).replace('"', '')[:-3]+ '0'
            # 为什么要这么做？经过解析后的url后面是200，会导致部分图片下载异常，如：后裔-如梦令，所以直接手动改为0
            
            print('{0}、{1}    已获取!\n'.format((count+1),name))
            fileName = name+ '.jpg'
            # print(filename)
            with open('./pic/' + fileName, 'wb') as file:
                img_url = requests.get(url)
                # 过滤部分无法访问图片
                if img_url.status_code ==200:
                    file.write(img_url.content)
                    count = count+ 1

    print('获取结束\n本次获取{0}页,{1}张图片!'.format(countPage, count))
    
except KeyboardInterrupt:
    print('非正常退出')
finally:
    print('\n本次总耗时{0:.2f}秒\t相当于{1:.2f}分钟'.format((time.time() - start), (time.time() - start) / 60))

这样我们就可以开始运行了

在这里插入图片描述

仅供参考学习

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python爬虫---王者荣耀(最详细) 的相关文章

windows通过SSH控制树莓派

windows通过SSH控制树莓派 xff1a 因学习需要在windows系统下对树莓派进行SSH连接 xff0c 包括SSH密钥生成密钥传输及公钥保存等 Windows下密钥的产生在Windows下使用 ssh keygen生成公钥和
raspistill command not found

raspistill command not found xff1a 提示 xff1a 这里简述项目相关背景 xff1a 今天使用树莓派来调用摄像头 xff0c 摄像头为树莓派官方摄像头 xff0c 在升级系统和配置后发现使用raspist
树莓派I2C基本用法

文章目录一 I2C二 I2C配置1 I2C02 I2C13 I2C34 I2C45 I2C56 I2C6 三 I2C工具总结一 I2C 树莓派默认打开I2C功能 xff0c 如果I2C没有打开 xff0c 可以使用命令sudo rasp
树莓派RTC

文章目录一 RTC准备二 RTC芯片三为什么使用hwclock显示找不到硬件总结一 RTC准备在使能树莓派RTC之前 xff0c 需要先为树莓派RTC模块安装电池 xff08 一般为纽扣电池 xff09 二 RTC芯片树莓派4B使
cpptools占用率过高

问题描述使用vscode发现在系统中cpptools CPU占用率达到百分百电脑发生严重卡顿解决方案 xff1a 此问题的出现是因为使用了C C 43 43 这个插件 xff0c 如果直接禁用此插件就可以解决这个问题如果希望使用这个
c语言状态机系统

读取文件并实现了把里面的数字读取出来并加以求平均数 include lt stdio h gt include lt string h gt using namespace std int a1 1000009 int r 61 0 int
快速创建kvm虚拟机（shell）

通过脚本的方式 xff0c 快速复制kvm虚拟机更改脚本变量使用脚本结果展示脚本如下 xff0c 已测试通过 usr bin env bash coding utf 8
windows安装虚拟机 Linux-ubuntu20.04.6 LTS x86_64(Py3.7.9）详细教程

安装虚拟机首先需要下载vmware 注意版本 xff0c 这里我下载的版本是 vmware最新版 xff08 17 0 0 build 20800274 xff09 17 0 0 build 20800274版本的密钥 xff1a MC6
基于51单片机实现时间显示及闹钟设置

文章目录一介绍二原理三步骤四结果五结果分析六总结一介绍本次为大学中的一次创新实验 xff0c 当时老师叫我自己拿个单片机去玩 xff0c 为了赶时间就做了个简单的时间显示和闹钟设置 xff0c 因为比较简单所以也把代码附
vim 文本替换

常规替换 n1 span class token punctuation span n2s hello world g span class token operator span 用world替换文件n1行到n2行所有的hello n1
51单片机定时器工作方式1、2原理详解

写在前面 1 本篇博文旨在帮助那些像我一样刚入门51单片机 xff0c 如果你对定时器有一定了解 xff0c 但是其中的的工作方式不能理解 xff0c 那么这篇文章很适合你 xff0c 如果你是大神的话直接绕行吧 2 我在学习的过程中由于
虚拟机Ubuntu连接不了网络的解决方法

昨晚上虚拟机ubuntu中网络还是正常使用的今天准备安装一个nfs服务发现无法使用apt工具了 xff0c 然后才发现虚拟机没网了 xff0c 然后在百度试了两种方法没有效果方法1 xff1a 尝试输入以下命令来解决 xff1a span
安装Anaconda并配置环境变量

安装Anaconda并配置环境变量下载安装配置变量下载安装 anaconda官网 xff1a https www anaconda com 选择需要的版本进行下载 https www anaconda com products dist
OrCAD 导出 BOM 表

BOM 表简介 BOM表是什么呢 xff1f 它的全称 xff08 Bill Of Material xff09 即物料清单的意思顾名思义 xff0c 一个产品的BOM说明了这个产品总共需要多少零配件来组装所有的PCBA制造商都需要根据
Allergo 导出光绘（Gerber）文件及坐标文件

文章目录导出 Gerber光绘介绍设置输出文件夹和路径生成钻孔信息导出光绘 ArcworkGerber 生成报错 database has error 导出坐标文件坐标文件介绍生成坐标文件参考资料导出 Gerber 光绘介绍 Gerb
cpp-http 库的使用

文章目录前言 96 cpp http 96 库简介 96 cpp http 96 库使用介绍http 客户端搭建步骤http 服务端搭建步骤 96 cpp http 96 库示例服务端实现客户端实现示例下载关于示例代码编译出错的问题参
esp32 开发环境搭建

文章目录前言提示构建工具安装 IDF设置 idf 目标平台设定环境变量同时安装多个版本安装 idf 和 tools修改环境变量参考资料ESP IDF 快速入门编译 ESP AT 工程idf py build 出现cmake faile
Latex之给字符上加横线、波浪线、^等

加号 xff1a hat x 加波浪线 xff1a widetilde x 加两个点 xff1a ddot x 以上几种对应结果 xff1a 如果是在正文中 xff1a 要在左右带上公式添加 xff1a overline X 61 fr
linux操作系统远程登录拷贝

1 SSH远程登录 xff1a 命令格式 xff1a ssh 用户名 64 IP地址命令选项ssh远程登录scp远程拷贝说明 SSH是专门为远程登录提供的一个协议 xff0c 常用于远程登录 xff0c 使用前需要安装相应的服务和客户端
VMware的Debian11如何删除磁盘文件，并在扩充原有磁盘

删除原有磁盘分区 1 在虚拟机 gt 设置中 xff0c 选中需要删除的磁盘分区文件 xff0c 点击移除 xff1b 2 如果此磁盘已设置开机自动挂载 xff0c 需要取消挂载 xff1a xff08 1 xff09 在 root

随机推荐

计算机视觉思维导图

计算机视觉思维导图最近整理的计算机视觉思维导图分享给大家 xff0c 来源于各个教学视频以及博客 xff0c 可以当做字典使用 xff0c 知道整个行业的方向及相关技术 xff0c 按照自己理解的视觉处理任务顺序排序
centos8安装docker错误解决

安装出现 Problem problem with installed package buildah Last metadata expiration check 0 08 17 ago on Sat 20 Feb 2021 12 43
c中输入一个十进制数，输出它的八进制二进制以及十六进制

代码 xff1a span class token macro property span class token directive keyword include span span class token string lt stdi
如何删除Alibaba PC Safe Service

如何删除Alibaba PC Safe Service Alibaba PC Safe Service是AlibabaProtect服务项目 xff0c Alibaba PC Safe Service这个东西在任务管理器里你是如论如何都关不
Yapi-从零搭建接口管理平台

介绍旨在为开发产品测试人员提供更优雅的接口管理服务可以帮助开发者轻松创建发布维护 API xff1b 官网网址 xff1a YApi 教程 hellosean1025 github io 搭建其实官网有明确的搭建方法 xff0
Sql 数据库细节全解（icelei讲sql）

磊哥哥讲Sql 一 what who defined1 数据库whatever2 引言导入二 database and tables guy1 Basic element project definition2 template data
编写一个Shell函数检查Linux系统中某文件的权限是否小于一个值

我编写了一个Shell函数 xff0c 使用这个函数需要传两个参数 xff1a 文件绝对路径和一个三位整数通过这个函数可以检查文件权限是否小于等于你给定的值 submod export filepath 61 1 export maxmo
codeforces 1328 B. K-th Beautiful String

题意 xff1a 就是找到第 k k k 个全排列的字符串通过找规律 xff0c 第一个 b b b 在倒数第二位有
使用python 解ccf-csp 2019-03-1小中大

传送问题描述问题分析这个题目最大值和最小值很好得到 xff0c 因为已经排好序了 xff0c 只需要判断一下是正序还是反序就可以了 xff0c 至于中位数我们得先清除它的概念 xff0c 如果不清楚 xff0c 也可以从给出来的例子判
ubuntu生成anaconda快捷方式

https blog csdn net weixin 45653050 article details 105636020
编码转换

编码定义在计算机硬件中 xff0c 编码 xff08 coding xff09 是在一个主题或单元上为数据存储 xff0c 管理和分析的目的而转换信息为编码值 xff08 典型地如数字 xff09 的过程在软件中 xff0c 编码意味着
Visual Studio Code安装go插件报错

VScode第一次跑go代码时提示The go outline command is not available Run 34 go get v github com ramya r有效解决安装方法出现问题 xff1a Visual St
TCP实现服务器与客户端的连接（多线程）

上一篇博客中 xff0c 我们用TCP实现了服务器与客户端的连接但是有一个问题 xff0c 即一个客户端在和服务器交互时 xff0c 其他客户端无法连接 xff0c 为解决这一问题 xff0c 我们将服务器端改造为线程池的版本 xff08
【GIT】在kali linux上安装git与码云提交|kali安装wps

xff11 安装git kali自带 xff0c xff08 apt get install git xff09 2 添加git服务用户 xff08 这一步不知道有没有用也输入了 xff0c 只是有点问题 xff09 useradd git
Windows10系统重装之U盘安装

1 准备工作操作系统 xff1a Windows 10 安装工具 xff1a U盘安装程序下载 xff1a MediaCreationTool 链接 xff1a https pan baidu com s 1GTnFze86sDjRnV
ubuntu18.04安装cuda和cudnn

一安装 cuda 1 首先查看自身电脑最高支持的cuda版本为多少 xff0c 在终端输入以下指令 nvidia smi 可以看到我的最高支持 cuda 11 4 2 打开英伟达官网下载官方cuda 此处我下载的是cuda 11 0 3
批处理打开指定路径下的所有文件

需求 xff1a 批处理打开指定路径下的所有文件前提 xff1a 默认各位同学已经熟悉常用的各种批处理命令 xff0c 本文仅对涉及到的批处理命令做简单的介绍 xff0c 有需要进一步学习 xff0c 可查阅网上其它资料也可通过CMD命
系统调用的概念及原理

系统调用与内核函数内核函数与普通函数形式上没有什么区别 xff0c 只不过前者在内核实现 xff0c 因此要满足一些内核编程的要求系统调用是用户进程进入内核的接口层 xff0c 它本身并非内核函数 xff0c 但它是由内核函数实现的 x
CMAKE编译ORB-SLAM2时，报错找不到Eigen3，报错Eigen3 found！之类错误（已解决）

当编译执行到 build sh文件时 xff0c 报错Eigen3 found xff01 之类错误解决方法 xff1a 在主文件夹下直接查找FindEigen3 cmake文件然后把它复制到报错的CMakeLists txt对应的路径
Python爬虫---王者荣耀(最详细)

Python爬虫王者荣耀最详细首先来到王者荣耀的首页点击游戏壁纸进去 xff0c 就会看到这些图片 xff0c 大致看了一下 xff0c 是我们想要的东西点开图片看看能不能找到什么规律可以看见每张图下面都有六个分辨率的选项 xf

Python爬虫---王者荣耀(最详细)

Python爬虫—王者荣耀(最详细)

Python爬虫---王者荣耀(最详细) 的相关文章

随机推荐

热门标签