python实战——下载推女郎图片

2023-11-07

说明

python2.7或3.4小脚本
这个小软件是和urllib和urllib2的使用结合了python网页获取异常的处理,原理非常简单,适合初学者练手~

功能

下载这个网站上的图片

成果

先放福利啦~
成果

分析

首先,想下载网站上的图片就需要获得图片的地址,正常套路是用正则在网页源代码中匹配到要下载的图片的网址,再下载,但是这回通过发现图片的路径是有规律的:

http://www.tuigirl8.com/tu/N/n.jpg

N代表第几期,n是代表第几张。
抓取截图
那么接下来就好办了,只要程序循环N和n,不断获取图片就能下载到了!
不过写出来报错,因为当让puython下载的网址不是图片的时候,会报错,程序也就终止了,好办,加个try:
最后修改好是下面的代码

最终成果

2.7版

#-*-coding:utf-8-*-
##python2.7 project

import re,urllib,urllib2

#--------------
No = 1
n = 9
#---------------
s = True
b = True
err = 0
def download_image(url, save_path): 
     urllib.urlretrieve(url, save_path)
#'http://www.tuigirl8.com/tu/no/n.jpg'
def download(No,n):
    html = 'http://www.tuigirl8.com/tu/%d/%d.jpg'%(No,n)

    dic = './%d_%d.jpg'%(No,n)
    try:
        response = urllib2.urlopen(html)  
        html1 = response.read()  
    except urllib2.URLError, e: 
        print'这个路径下没有图片,跳过'
        s = False 
        return s

    else:
        download_image(html,dic)
        print'下载成功%s'%dic
        s = True
        return s
while b:

    if download(No,n) == False:
        err+=1
        if err == 15:
            No+=1
    n+=1        


print 'ok!'

3.4版

#-*-coding:utf-8-*-
#python3.4 project

import urllib.request,urllib.error

#--------------
No = 1
n = 9
#---------------
s = True
b = True
err = 0
def download_image(url, save_path): 
    urllib.request.urlretrieve(url, save_path)
#'http://www.tuigirl8.com/tu/no/n.jpg'
def download(No,n):
    html = 'http://www.tuigirl8.com/tu/%d/%d.jpg'%(No,n)

    dic = './%d_%d.jpg'%(No,n)
    try:
        response = urllib.request.urlopen(html)  
      #  html= response.()  
    except urllib.error.URLError as e: 
        print('这个路径下没有图片,跳过')
        s = False 
        return s

    else:
        download_image(html,dic)
        print('下载成功')
        s = True
        return s
while b:

    if download(No,n) == False:
        err+=1
        if err == 15:
            No+=1
    n+=1        


print ('ok!')

版权声明:本文为博主原创文章,未经博主允许不得转载。

转载于:https://www.cnblogs.com/broven/p/4730810.html

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

python实战——下载推女郎图片 的相关文章

  • NameError:名称“urllib”未定义”

    CODE import networkx as net from urllib request import urlopen def read lj friends g name fetch the friend list from Liv
  • python pandas 中的双端队列

    我正在使用Python的deque 实现一个简单的循环缓冲区 from collections import deque import numpy as np test sequence np array range 100 2 resha
  • 使用 OpenPyXL 迭代工作表和单元格,并使用包含的字符串更新单元格[重复]

    这个问题在这里已经有答案了 我想使用 OpenPyXL 来搜索工作簿 但我遇到了一些问题 希望有人可以帮助解决 以下是一些障碍 待办事项 我的工作表和单元格数量未知 我想搜索工作簿并将工作表名称放入数组中 我想循环遍历每个数组项并搜索包含特
  • 循环中断打破tqdm

    下面的简单代码使用tqdm https github com tqdm tqdm在循环迭代时显示进度条 import tqdm for f in tqdm tqdm range 100000000 if f gt 100000000 4 b
  • Numpy 优化

    我有一个根据条件分配值的函数 我的数据集大小通常在 30 50k 范围内 我不确定这是否是使用 numpy 的正确方法 但是当数字超过 5k 时 它会变得非常慢 有没有更好的方法让它更快 import numpy as np N 5000
  • Python:计算字典的重复值

    我有一本字典如下 dictA unit1 test1 alpha unit1 test2 beta unit2 test1 alpha unit2 test2 gamma unit3 test1 delta unit3 test2 gamm
  • VSCode:调试配置中的 Python 路径无效

    对 Python 和 VSCode 以及 stackoverflow 非常陌生 直到最近 我已经使用了大约 3 个月 一切都很好 当尝试在调试器中运行任何基本的 Python 程序时 弹出窗口The Python path in your
  • 在 Pandas DataFrame Python 中添加新列[重复]

    这个问题在这里已经有答案了 例如 我在 Pandas 中有数据框 Col1 Col2 A 1 B 2 C 3 现在 如果我想再添加一个名为 Col3 的列 并且该值基于 Col2 式中 如果Col2 gt 1 则Col3为0 否则为1 所以
  • 协方差矩阵的对角元素不是 1 pandas/numpy

    我有以下数据框 A B 0 1 5 1 2 6 2 3 7 3 4 8 我想计算协方差 a df iloc 0 values b df iloc 1 values 使用 numpy 作为 cov numpy cov a b I get ar
  • 改变字典的哈希函数

    按照此question https stackoverflow com questions 37100390 towards understanding dictionaries 我们知道两个不同的字典 dict 1 and dict 2例
  • 使用 ElementTree 时出现未定义实体错误

    我有一组 XML 文件 需要读取它们并将其格式化为单个 CSV 文件 为了读取 XML 文件 我使用了提到的解决方案here https stackoverflow com questions 5530857 parse xml file
  • 如何将列表列表中的元素转换为小写? [复制]

    这个问题在这里已经有答案了 我正在尝试将列表列表的元素转换为小写 这就是看起来的样子 print dataset It went Through my shirt And came out The back and hit the kid
  • 在 PYTHON 中读取 EXCEL 时,“utf-16-le”编解码器无法解码字节

    我正在尝试读取不同语言 阿拉伯语 希腊语 意大利语 希伯来语等 的各种数量的 xls 文件 当我尝试调用 open workbook 函数时 出现如下所示的错误 不知道如何将格式设置为任何语言 Code book xlrd open wor
  • 将 SSH 密钥文件与 Fabric 结合使用

    如何配置结构以使用 SSH 密钥文件连接到远程主机 例如 Amazon EC2 实例 由于某种原因 找到一个带有 SSH 密钥文件使用示例的简单 fabfile 并不容易 我写了一个博客文章 http blog y3xz com post
  • 如何在 R 或 Python 中制作旭日图?

    到目前为止 我一直无法找到一个可以创建旭日图的 R 库约翰 斯塔斯科 http www cc gatech edu gvu ii sunburst 有人知道如何在 R 或 Python 中实现这一点吗 在极坐标投影中使用 matplotli
  • Python:删除字符串开头的数字

    我有一些这样的字符串 string1 123 123 This is a string some other numbers string2 1 This is a string some numbers string3 12 3 12 T
  • RTSP 设置后接收 RTP 数据包

    我正在尝试使用 Python 从 IP 摄像机流式传输 RTP 数据包 我能够使用 RTSP 协议发送描述 设置和播放命令 但是 我无法开始使用 RTP 传输实际视频流 这是代码 import socket def printrec rec
  • 在 python 中将变量传递给重定向上的模板

    我对 Python 比较陌生 所以请原谅任何幼稚的问题 我的主页有 2 个输入 一个用于 产品 一个用于 电子邮件 当用户单击 提交 时 他们应该被发送到 success 其中会显示 您已请求 产品 您将通过 电子邮件 收到通知 我试图找出
  • 跨行对 Pandas 数据框进行分组 - 2.0

    进一步这个问题跨行对 Pandas 数据框进行分组 https stackoverflow com questions 46995997 grouping pandas dataframe across rows 操作是 amount cl
  • 用于将 cython 中的许多 C++ 类包装到单个共享对象的项目结构

    我在文档 邮件列表和这个问题在这里 https stackoverflow com questions 10300660 cython and distutils 但我想得到一个更直接的答案来解决我的具体情况 我正在通过尝试一点一点地包装我

随机推荐

  • java 中unsigned类型的转换

    java 中unsigned类型的转换
  • oh-my-zsh安装与常用插件

    zsh 介绍 工欲善其事 必先利其器 zsh也是一种 shell 兼容最常用的 bash 这种 shell 的命令和操作 bash 虽然很标准 但是自己日常使用方便更重要 oh my zsh 提供了丰富的插件和提 安装 先使用命令查看系统支
  • whisper:robust speech recognition via large-sacle weak supervision

    OpenAI Whisper 精读 论文精读 45 哔哩哔哩 bilibili更多论文 https github com mli paper reading 视频播放量 68331 弹幕量 327 点赞数 2332 投硬币枚数 1192 收
  • QJsonObject的使用示例

    介绍 负责封装JSON对象 是键 值对列表 其中键是惟一的字符串 值由QJsonValue表示 1 QJsonObjec 封装了Json里的对象 接口与QMap相似 都具有size insert 和remove 等操作 还可以使用标准C 迭
  • SQL Server(三)-查询数据(2)

    函数与分组查询数据 一 系统函数 在SQL Server 2008中系统函数是指在SQL Server 2008中自带的函数 主要分为聚合函数 数据类型转换函数 日期函数 数学函数及其他一些常用的函数 1 聚合函数 对一组值进行计算 然后返
  • 雅思词汇表8000词版_你别不信,雅思光靠背单词也能上6.5!

    点击上方蓝字关注我哦 打算备考雅思 大家都是知道IELTS考试对词汇量要求是比较高的 如果自身的英语基础薄弱 想短时间内在雅思成绩上有所突破是很困难的一件事情 因此很多考生会 病急乱投医 购买各式各样雅思词汇手册进行疯狂记忆 每本单词手册都
  • Keil 重定向 fputc 函数 以及 printf 函数的代码尺寸测试

    本文的开发环境为 Keil Cortex M3 内核处理器 重定向 fputc 函数方法 如果想使用库函数 printf 必须要将 fputc 重定向到自己的串口上 术语 重定向 可以理解为用户重写 fputc 函数 在重写的函数体内调用自
  • vulnhub-KIOPTRIX: LEVEL 1.3 (#4)-KioptrixVM4靶场

    以下演示均在测试环境进行 遵纪守法 靶场下载地址 Kioptrix Level 1 3 4 VulnHub 镜像下载解压之后是一个 vhd文件 需要新建虚拟机 虚拟机操作系统任选一个linux系列的系统 一直下一步 到了设置磁盘 按照截图设
  • Qt系列文章之(十) ui文件的使用

    上一篇文章在主函数中构造了一个简单的主窗口界面 继承了一些基本元素 如菜单栏 工具栏 悬浮窗口 主界面等元素 不过这些元素都是在栈区开辟的临时变量 放在主函数里面来实现 这不是一种标准的UI界面开发手段 一般在界面项目开发之中有几个典型的开
  • PyCharm远程连接失败、错误,报错:Can‘t connect...【解决方法与错误分析】

    学习网站推荐 前些天发现了一个巨牛的人工智能学习网站 通俗易懂 风趣幽默 忍不住分享一下给大家 点击跳转到网站 文章目录 一 前言 二 报错 2018版 2020版 三 错误分析 我的错误原因 其他3种可能因粗心导致的原因 四 如果你不想再
  • HTTPX从入门到放弃

    1 什么是HTTPX HTTPX是一款Python栈HTTP客户端库 它提供了比标准库更高级别 更先进的功能 如连接重用 连接池 超时控制 自动繁衍请求等等 HTTPX同时也支持同步和异步两种方式 因此可以在同步代码和异步代码中通用 HTT
  • Swift语法学习--协议基础

    文章目录 协议定义 typealias关键词类型定义新的名称 associatedtype增加协议功能 协议定义 typealias关键词类型定义新的名称 不做赘述 typealias Distance Double typealias P
  • 游戏对象与图形基础

    游戏对象与图形基础 这是有游戏编程的第四次作业 对MVC深入 文章目录 游戏对象与图形基础 说明文档 作业内容 1 基本操作演练 建议做 2 编程实践 需求分析 新版的设计与实现 说明文档 本次实验完成了所有基本要求 尽量将步骤展示出 闪光
  • java中把判断大小的字符串转换成可判断的布尔值

    ScriptEngineManager manager new ScriptEngineManager ScriptEngine se manager getEngineByName js String str 1 lt 3 boolean
  • OpenCV

    OpenCV polylines绘制多边形 1 四边形 Mat image 300 300 CV 8UC3 Scalar 255 255 255 300X300大小的白色图像 Point pnt 1 4 Point 100 100 左上角
  • 【计算机网络】Linux环境中的网络套接字编程

    文章目录 前言 一 预备知识 理解源IP地址和目的IP地址 认识端口号 认识UDP协议和TCP协议 了解网络字节序 二 socket 套接字 socket 常见API sockaddr 和 sockaddr in 三 UDP Socket编
  • .Net web service studio的使用

    无意间发现有个比较好的工具 它很小才几十K而已 真的很轻量 就是web service studio 可以用来测试web service 因为web service因为其返回结果的特殊性以及请求的不一样 平时也很难去测试这个接口到底能否使用
  • 系统分析与设计-用例建模之业务建模方法

    系统分析与设计 用例建模之业务建模方法 文章目录 系统分析与设计 用例建模之业务建模方法 使用 UMLet 建模 根据订旅馆建模文档 根据课程练习 投递员使用投递箱给收件人快递包裹 的业务场景 根据上述流程 给出快递柜系统最终的用例图模型
  • csrf攻击原理与解决方法_前端

    1 CSRF 的攻击类型 CSRF 全称 Cross Site Request Forgery 跨站请求伪造 也被称为 XSRF one click attack 或者 session riding 是一种劫持受信任用户向服务器发送非预期请
  • python实战——下载推女郎图片

    说明 python2 7或3 4小脚本 这个小软件是和urllib和urllib2的使用结合了python网页获取异常的处理 原理非常简单 适合初学者练手 功能 下载这个网站上的图片 成果 先放福利啦 分析 首先 想下载网站上的图片就需要获