Python抓取网页图片

2023-05-16

网上的代码基本上都是python2，这里的代码使用的是python3注意没有urllib2这个库了。

要先做几个个准备工作：

①找到有图片的网站

②指定电脑保存路径

③利用浏览器工具查看网页代码中图片的保存路径（非常重要，如果错误可能抓取不到）

下面给出代码：

注意看注释

import re
import urllib.request  # Python2中使用的是urllib2
import urllib
import os


def getHtml(url):
    '获取网站地址'
    page = urllib.request.urlopen(url)
    html = page.read()

    return html.decode('UTF-8')


def getImg(html):
    '图片地址注意要从浏览器中查看网页源代码找出图片路径'
    # 要加括号，作为元组返回
    #reg = r'src="(.+?\.jpg)" pic_ext'  # 某个贴吧的图片
    reg = r'data-progressive="(.+?\.jpg)" '  # Bing壁纸合集抓取地址
    # reg = r'src="(.+?\.jpg)" '  # 我的网站图片地址
    # reg = r'zoomfile="(.+?\.jpg)" '  # 威锋网手机壁纸
    imgre = re.compile(reg)
    imglist = imgre.findall(html)
    x = 0
    path = 'E:\\Temporary\\new'     # 输入保存文件的目录地址
    if not os.path.isdir(path):
        os.makedirs(path)   # 检查是否存在地址，如果不存在将自动创建文件夹目录
    paths = path + '\\'  # 保存在test路径下
    for imgurl in imglist:
        urllib.request.urlretrieve(imgurl, '{}{}.jpg'.format(paths, x))
        x = x + 1


if __name__ == '__main__':
   # html = getHtml("http://bbs.feng.com/read-htm-tid-10616371.html")  # 威锋网手机壁纸
   # html = getHtml("http://www.omegaxyz.com/")  # 我的网站图片地址
    html = getHtml("https://bing.ioliu.cn/ranking")  # Bing壁纸合集抓取地址
   # html = getHtml("http://tieba.baidu.com/p/2460150866")  # 某个贴吧的图片
    getImg(html)

注意以上代码在pycharm python3.6.2环境运行

效果截图：
这里写图片描述

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

抓取网页图片

Python抓取网页图片的相关文章

如何在python中读取多个文件中的文本

我的文件夹中有许多文本文件大约有 3000 个文件每个文件中第 193 行是唯一包含重要信息的行我如何使用 python 将所有这些文件读入 1 个文本文件 os 模块中有一个名为 list dir 的函数该函数返回给定目录中所有文
如何在刻度标签和轴之间添加空间

我已成功增加刻度标签的字体但现在它们距离轴太近了我想在刻度标签和轴之间添加一点呼吸空间如果您不想全局更改间距通过编辑 rcParams 并且想要更简洁的方法请尝试以下操作 ax tick params axis both whic
如何生成给定范围内的回文数列表？

假设范围是 1 X 120 这是我尝试过的 gt gt gt def isPalindrome s check if a number is a Palindrome s str s return s s 1 gt gt gt def ge
如何收集列表、字典等中重复计算的结果（或制作修改每个元素的列表的副本）？

There are a great many existing Q A on Stack Overflow on this general theme but they are all either poor quality typical
如何在 Sublime Text 2 的 OSX 终端中显示构建结果

我刚刚从 TextMate 切换到 Sublime Text 2 我非常喜欢它让我困扰的一件事是默认的构建结果显示在 ST2 的底部我的程序产生一些很长的结果显示它的理想方式如在 TM2 中是并排查看它们如何在 Mac 操作系统
打破嵌套循环[重复]

这个问题在这里已经有答案了有没有比抛出异常更简单的方法来打破嵌套循环在Perl https en wikipedia org wiki Perl 您可以为每个循环指定标签并且至少继续一个外循环 for x in range 10 fo
如何使用装饰器禁用某些功能的中间件？

我想模仿的行为csrf exempt see here https docs djangoproject com en 1 11 ref csrf django views decorators csrf csrf exempt and h
keras加载模型错误尝试将包含17层的权重文件加载到0层的模型中

我目前正在使用 keras 开发 vgg16 模型我用我的一些图层微调 vgg 模型拟合我的模型训练后我保存我的模型model save name h5 可以毫无问题地保存但是当我尝试使用以下命令重新加载模型时load mod
在循环中每次迭代开始时将变量重新分配给原始值（在循环之前定义）

在Python中你使用在每次迭代开始时将变量重新分配给原始值在循环之前定义时也就是说 original 1D o o o for i in range 0 3 new original 1D revert back to orig
使用 Pycharm 在 Windows 下启动应用程序时出现 UnicodeDecodeError

问题是当我尝试启动应用程序 app py 时我收到以下错误 UnicodeDecodeError utf 8 编解码器无法解码位置 5 中的字节 0xb3 起始字节无效整个文件app py coding utf 8 from flask
Python - 在窗口最小化或隐藏时使用 pywinauto 控制窗口

我正在尝试做的事情我正在尝试使用 pywinauto 在 python 中创建一个脚本以在后台自动安装 notepad 隐藏或最小化 notepad 只是一个示例因为我将编辑它以与其他软件一起使用 Problem 问题是我想在安装程序
Python 3 中“map”类型的对象没有 len()

我在使用 Python 3 时遇到问题我得到了 Python 2 7 代码目前我正在尝试更新它我收到错误类型错误 map 类型的对象没有 len 在这部分 str len seed candidates 在我像这样初始化它之前 se
如何将 PIL 图像转换为 NumPy 数组？

如何转换 PILImage来回转换为 NumPy 数组这样我就可以比 PIL 进行更快的像素级转换PixelAccess允许我可以通过以下方式将其转换为 NumPy 数组 pic Image open foo jpg pix numpy
在 Pandas DataFrame Python 中添加新列[重复]

这个问题在这里已经有答案了例如我在 Pandas 中有数据框 Col1 Col2 A 1 B 2 C 3 现在如果我想再添加一个名为 Col3 的列并且该值基于 Col2 式中如果Col2 gt 1 则Col3为0 否则为1 所以
glpk.LPX 向后兼容性？

较新版本的glpk没有LPXapi 旧包需要它我如何使用旧包例如COBRA http opencobra sourceforge net openCOBRA Welcome html 与较新版本的glpk 注意COBRA适用于 MATL
使用基于正则表达式的部分匹配来选择 Pandas 数据帧的子数据帧

我有一个 Pandas 数据框它有两列一列进程参数列包含字符串另一列值列包含相应的浮点值我需要过滤出部分匹配列过程参数中的一组键的子数据帧并提取与这些键匹配的数据帧的两列 df pd DataFrame Proce
在 Python 类中动态定义实例字段

我是 Python 新手主要从事 Java 编程我目前正在思考Python中的类是如何实例化的我明白那个 init 就像Java中的构造函数然而有时 python 类没有 init 方法在这种情况下我假设有一个默认构造函数就像
您可以在 Python 类型注释中指定方差吗？

你能发现下面代码中的错误吗米皮不能 from typing import Dict Any def add items d Dict str Any gt None d foo 5 d Dict str str add items d f
协方差矩阵的对角元素不是 1 pandas/numpy

我有以下数据框 A B 0 1 5 1 2 6 2 3 7 3 4 8 我想计算协方差 a df iloc 0 values b df iloc 1 values 使用 numpy 作为 cov numpy cov a b I get ar
Spark.read 在 Databricks 中给出 KrbException

我正在尝试从 databricks 笔记本连接到 SQL 数据库以下是我的代码 jdbcDF spark read format com microsoft sqlserver jdbc spark option url jdbc sql

随机推荐

数据结构串的基本操作及KMP算法

将串的基本操作C语言实现 xff0c 实现KMP算法算出NEXT函数和NEXTVAL的值 SqString h的基本内容 span class hljs keyword typedef span span class hljs keywor
JAVA经典面试题（来源于互联网）

面向对象编程 xff08 OOP xff09 Java是一个支持并发基于类和面向对象的计算机编程语言下面列出了面向对象软件开发的优点 xff1a 代码开发模块化 xff0c 更易维护和修改代码复用增强代码的可靠性和灵活性增加代码的
规则绝对公平时，社会财富的流向谁？

从知乎有一个很有趣的问题 xff1a 房间里有100个人 xff0c 每人都有100元钱 xff0c 如果每过一分钟 xff0c 每个人都要拿出一元钱随机给另一个人 xff0c 最后这100个人的财富分布是怎样的 xff1f 这个问题 xf
2017程序员综合素质调研测试

只要志愿选得好 xff0c 年年期末是高考高等数学线性代数 C语言计算机导论数据结构离散数学电子技术 C 43 43 程序设计汇编语言程序设计计算机组成原理编译原理操作系统数据库原理 JAVA程序设计 Python 下
机器学习非平衡数据集概述

定义 xff1a 不平衡数据集 xff1a 在分类等问题中 xff0c 正负样本 xff0c 或者各个类别的样本数目不一致研究不平衡类通常认为不平衡意味着少数类只占比10 20 实际上 xff0c 一些数据集远比这更不平衡例如 xff1
汇编语言32位加减乘除运算题

用16位指令编制程序 xff0c 处理32位的加减乘除算术四则运算题本文计算 xff08 3 X 43 Y Z xff09 5的值值分别为 xff1a span class hljs built in x span dw span cl
汇编语言字符串比较与查找

答案仅供参考 xff0c 大家还是自己写比较好汇编语言实现用字符串处理指令编制程序 xff0c 处理字符串的比较和查找 xff0c 显示结果要求 xff1a xff08 1 xff09 字符串的比较函数中 xff0c 一个字符串在数据
汇编语言数据段查找ASCII码并回显

实验要求 xff1a 在数据段预先存放16个十六进制的ASCII码 xff0c 首地址为ASC 从键盘输入一位十六进制数到BX xff0c 用ASC BX xff08 寄存器相对寻址 xff09 寻址方式找到对应数位的ASCII码 xff0
汇编语言将正负数复制到不同的数组

分离字数组ARRAY中的正 xff0c 负数 xff0c 把其中的正数复制到PDATA数组 xff1a 负数复制到NDATA数组 xff0c 并分别统计正负数个数 DATAS SEGMENT array dw span class hlj
JAVA工程师最新面试题（来源于互联网）

面向对象编程 xff08 OOP xff09 Java是一个支持并发基于类和面向对象的计算机编程语言下面列出了面向对象软件开发的优点 xff1a 代码开发模块化 xff0c 更易维护和修改代码复用增强代码的可靠性和灵活性增加代码的
关于内存溢出异常的查看以及解决办法

内存溢出又称为OOM OutOfMemoryError 处理内存溢出首先要查看是否是由于内存泄露 Memory Leak 造成的内存溢出 Memory Overflow 可以使用内存影响分析工具如 Eclipse Memory Ana
JAVA基本程序设计规范

1 标识符是程序中用于命名诸如变量常量方法类包之类元素的名称 2 标识符是由字母数字下划线和美元符号构成的字符序列标识符必须以字母或下划开头 xff0c 不能以数字开头标识符不能是保留字标识符可以为任意长度 3 变量
多目标优化问题概述

图片不清楚请看多目标问题详解 xff1a 多目标问题详解更多内容访问omegaxyz com 定义 xff1a 若干冲突或相互影响条件约束下在给定区域内寻找尽可能的最优解 xff08 非劣解 xff09 关键词 xff1a 条件约束 xf
NSGA2算法中文版详细介绍

NSGA2主要是对NSGA算法的改进 NSGA是N Srinivas 和 K Deb在1995年发表的一篇名为 Multiobjective function optimization using nondominated sorting
特征选择算法综述

特征选择 xff08 feature selection xff09 作为一种常见的降维方法是模式识别的研究热点之一它是指从原始特征集中选择使某种评估标准最优的特征子集其目的是使选出的最优特征子集所构建的分类或回归模型达到和特征选择前近
多目标优化详解【转载】

欢迎大家访问我的网站发现更多内容omegaxyz com 多目标优化问题详解生活中许多问题都是由相互冲突和影响的多个目标组成人们会经常遇到使多个目标在给定区域同时尽可能最佳的优化问题也就是多目标优化问题优化问题存在的优化目标超过一
Python 编写规范

用IDE写Python编写时有时会有标记 xff0c 但是程序能正常运行 xff0c 这里的标记是python编写不规范 xff0c 下面给出一些规范写法一行列数 PEP 8 规定为 79 列 xff0c 这个太苛刻了 xff0c 如果要
Python求解排列中的逆序数个数

在一个排列中 xff0c 如果一对数的前后位置与大小顺序相反 xff0c 即前面的数大于后面的数 xff0c 那么它们就称为一个逆序一个排列中逆序的总数就称为这个排列的逆序数一个排列中所有逆序总数叫做这个排列的逆序数也就是说 xff0
Python利用shelve模块设计简单数据库程序

欢迎访问我的网站omegaxyz com 利用shelve模块写数据库文件在程序关闭时仍然能存储之前的数据将所有内容都放到函数中会让程序更加结构化主程序放在main函数中 xff0c 只有在if name 61 61 main 条件成立
Python抓取网页图片

网上的代码基本上都是python2 xff0c 这里的代码使用的是python3注意没有urllib2这个库了要先做几个个准备工作 xff1a 找到有图片的网站指定电脑保存路径利用浏览器工具查看网页代码中图片的保存路径 xff08 非

Python抓取网页图片

Python抓取网页图片 的相关文章

随机推荐

热门标签

Python抓取网页图片的相关文章