Python学习之------retry（异常重试）

2023-10-30

在做数据抓取的时候，经常遇到由于网络问题导致的程序保存，先前只是记录了错误内容，并对错误内容进行后期处理。

原先的流程：

def crawl_page(url):
    pass

def log_error(url):
    pass

url = ""
try:
   crawl_page(url)
except:
    log_error(url)

改进后的流程：

attempts = 0
success = False
while attempts < 3 and not success:
    try:
        crawl_page(url)
        success = True
    except:
        attempts += 1
        if attempts == 3:
            break

最近发现的新的解决方案：retrying

retrying是一个 Python的重试包，可以用来自动重试一些可能运行失败的程序段。retrying提供一个装饰器函数retry，被装饰的函数就会在运行失败的条件下重新执行，默认只要一直报错就会不断重试。

import random
from retrying import retry

@retry
def do_something_unreliable():
    if random.randint(0, 10) > 1:
        raise IOError("Broken sauce, everything is hosed!!!111one")
    else:
        return "Awesome sauce!"

print do_something_unreliable()

如果我们运行have_a_try函数，那么直到random.randint返回5，它才会执行结束，否则会一直重新执行。
retry还可以接受一些参数，这个从源码中Retrying类的初始化函数可以看到可选的参数：

1、stop_max_attempt_number：用来设定最大的尝试次数，超过该次数就停止重试
2、stop_max_delay：比如设置成10000，那么从被装饰的函数开始执行的时间点开始，到函数成功运行结束或者失败报错中止的时间点，只要这段时间超过10秒，函数就不会再执行了
3、wait_fixed：设置在两次retrying之间的停留时间
4、wait_random_min和wait_random_max：用随机的方式产生两次retrying之间的停留时间
5、wait_exponential_multiplier和wait_exponential_max：以指数的形式产生两次retrying之间的停留时间，产生的值为2^previous_attempt_number * wait_exponential_multiplier，previous_attempt_number是前面已经retry的次数，如果产生的这个值超过了wait_exponential_max的大小，那么之后两个retrying之间的停留值都为wait_exponential_max。这个设计迎合了exponential backoff算法，可以减轻阻塞的情况。
我们可以指定要在出现哪些异常的时候再去retry，这个要用retry_on_exception传入一个函数对象：

def retry_if_io_error(exception):
    return isinstance(exception, IOError)

@retry(retry_on_exception=retry_if_io_error)
def read_a_file():
    with open("file", "r") as f:
        return f.read()

在执行read_a_file函数的过程中，如果报出异常，那么这个异常会以形参exception传入retry_if_io_error函数中，如果exception是IOError那么就进行retry，如果不是就停止运行并抛出异常。

我们还可以指定要在得到哪些结果的时候去retry，这个要用retry_on_result传入一个函数对象：

def retry_if_result_none(result):
    return result is None

@retry(retry_on_result=retry_if_result_none)
def get_result():
    return None

在执行get_result成功后，会将函数的返回值通过形参result的形式传入retry_if_result_none函数中，如果返回值是None那么就进行retry，否则就结束并返回函数值。

原文：https://www.biaodianfu.com/python-error-retry.html

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python爬虫

Python学习之------retry（异常重试）的相关文章

selenium用法详解【从入门到实战】【Python爬虫】【4万字】

跳转文末获取实战源码与作者联系方式共同学习进步文章目录简介 selenium安装安装浏览器驱动确定浏览器版本下载驱动定位页面元素打开指定页面 id 定位 name 定位 class 定位 tag 定位 xpath 定位 c
python爬取英雄联盟所有皮肤

import jsonpath import requests import json import os import time 程序开始时间 start time time from tqdm import tqdm from time
urllib库的使用

个人简介作者简介大家好我是W chuanqi 一个编程爱好者个人主页 W chaunqi 支持我点赞收藏留言愿你我共勉若身在泥潭心也在泥潭则满眼望去均是泥潭若身在泥潭而心系鲲鹏则能见九万里天地文章目录 urll
【2】Python爬虫：分析AJAX传递的JSON获取数据-初步分析动态网页（1）

前言这是本人写的第二篇文章希望能够帮助到一些和我一样的python爬虫初学者在第一篇文章中我总结了最近学到的利用requests和bs4第三方库共同作用基本可以应对python获取静态网页数据的相关问题但是如果现实中的网页往往比
Python爬虫该怎么学习？学习步骤是什么？

学Python 想必大家都是从爬虫开始的吧 python爬虫即网络爬虫网络爬虫是一种程序主要用于搜索引擎它将一个网站的所有内容与链接进行阅读并建立相关的全文索引到数据库中然后跳到另一个网站搜索引擎 SearchEngine 是
python模拟登录京东网页

目标网站京东网首页登录目标网址 https www jd com 任务要求 1 导入selenium库并使用该库驱动Chrom浏览器完成请求 2 驱动浏览器对象找到登录按钮点击 3 在新页面中选择账号登录 4 找到用户名和密码输
用Python分析2000款避孕套，得出这些有趣的结论

前言本文的文字及图片来源于网络仅供学习交流使用不具有任何商业用途如有问题请及时联系我们以作处理 PS 如有需要Python学习资料的小伙伴可以加点击下方链接自行获取 python免费学习资料以及群交流解答点击即可加入一分析目标
爬虫需要知道的基础

一爬虫概述 1 爬虫必须知道的要素爬虫要遵循网上的爬虫机器人协议怎样查看在网址后面加上 robots txt来查看可以查到哪些是允许的哪些是不允许的爬虫的基本步骤找到网址发起请求解析页面并获得原始数据对数据进行处理保
Python爬虫实战之电影爬取过程

俗话说兴趣所在方能大展拳脚 so结合兴趣的学习才能事半功倍更加努力专心 apparently本次任务是在视频网站爬取一些好看的小电影地址不放狗头保命只记录过程实现功能从网站上爬取采用m3u8分段方式的视频文件对加密的 ts
Python爬虫（一）：编写简单爬虫之新手入门

最近学习了一下python的基础知识大家一般对爬虫这个词一听就比较熟悉都知道是爬一些网站上的数据然后做一些操作整理得到人们想要的数据但是怎么写一个爬虫程序代码呢相信很多人是不会的今天写一个针对新手入门想要学习爬虫的文章
python爬虫第9天用爬虫测试网站远程采集

网站的前端通常并没有自动化测试尽管前端才是整个项目中真正与用户零距离接触的唯一一个部分想象有一个由测试驱动的网络开发项目每天进行测试以保证网络接口的每个环节的功能都是正常的每当有新的特性加入网站或者一个元素的位置改变时就执行
Python实现输入电影名字自动生成豆瓣评论词云图（带GUI界面）小程序

Python实现输入电影名字自动生成豆瓣评论词云图带GUI界面小程序一项目背景电影逐渐成为人们生活的不可或缺的一部分而了解一部电影的可以通过电影评分与大众推荐度但以上的方式都太过于片面了解一部电影的方法是通过已经观看完电影的
同花顺某v参数详解

声明本文章中所有内容仅供学习交流抓包内容敏感网址数据接口均已做脱敏处理严禁用于商业用途和非法用途否则由此产生的一切后果均与作者无关若有侵权请联系我立即删除目标站点 aHR0cDovL3EuMTBqcWthLmNvbS5jb
知乎美女挖掘指南--Python实现自动化图片抓取、颜值评分

声明文中所有文字图片以及相关外链中直接或间接明示或暗示涉及性别颜值分数等信息全部由相关人脸检测接口给出无任何客观性仅供参考 1 数据源知乎话题美女下所有问题中回答所出现的图片 2 抓取工具 Python 3 并使用第三方
Python爬虫实战，requests模块，Python实现IMDB电影top数据可视化

前言利用Python爬取IMDB电影废话不多说让我们愉快地开始吧开发工具 Python版本 3 6 4 相关模块 requests模块 random模块 bs4模块以及一些Python自带的模块环境搭建安装Python并添加到
Mysql数据库的环境搭建【详细】

作者简介大学机械本科野生程序猿学过C语言玩过前端还鼓捣过嵌入式设计也会一点点不过如今痴迷于网络爬虫因此现深耕Python 数据库 seienium JS逆向安卓逆向等等目前为全职爬虫工程师学习的过程喜欢记录目前已经写
Python爬虫

一什么是代理二代理服务器的作用可以进行请求的响应和转发三在爬虫中为何要使用代理如果我们使用爬虫对一个网站在一段时间内发起一个高频请求该网站会检测出这个异常的现象并将异常的请求 IP 获取将 IP 加入到黑名单然后改 I
python3爬虫伪装代理IP

在爬取类似起点色魔张大妈这样的网站时会被网站看出是爬虫机制这时需要伪装成浏览器以及使用IP代理的方式来爬去正常内容实例 import re import requests import urllib request from l
Python获取去哪儿旅游数据并作可视化攻略

嗨喽大家好呀这里是爱看美女的茜茜呐开发环境版本 python 3 8 编辑器 pycharm 第三方库 requests gt gt gt pip install requests parsel gt gt gt pip inst
Python采集猎聘网站招聘数据内容，看看现在职位风向

嗨喽大家好呀这里是爱看美女的茜茜呐环境使用 Python 3 10 Pycharm 模块使用第三方模块需安装 requests gt pip install requests pandas gt pip install panda

随机推荐

Building and Installing ACE and Its Auxiliary Libraries and Services

Synopsis The file explains how to build and install ACE its Network Services test suite and examples on the various OS p
Python多线程同时处理多个文件

前言在需要对大量文件进行相同的操作时逐个遍历是非常耗费时间的这时我们可以借助于Python的多线程操作来大大提高处理效率减少处理时间问题背景比如说我们现在需要从一个文件夹下面读取出所有的视频然后对每个视频进行逐帧处理由于
Geogebra求一道极难的几何题

第2小题答案是45 Geogebra文件下载链接 https caiyun 139 com m i 0E5CKWJDt7wMr 提取码 WSev
C++面向对象之对象的初始化和清理

对象的初始化和清理生活中我们买的电子产品都会有基本的出厂设置在某一天我们不用的时候会删除一些自己信息数据保证安全 C 中的面向对象来源于生活每个对象也都会有初始设置以及对象销毁前的清理数据的设置构造函数和析构函数对象的初始化和清理
ReenTranReadWriteLock 读写锁笔记

参考博客链接 1 https blog csdn net qq 19431333 article details 70568478 2 https blog csdn net yanyan19880509 article details 5
aix命令tar包命令应用

打包并压缩gzip格式利用ftp传输到远程服务器上 tar cvf ciod appuser gzip qc gt ciod appuser tar gzip ftp v n 192 1 1 48 lt
【技巧】如何在 GitHub 上高效阅读源码？

在 GitHub 上高效阅读源码的方法有以下几种方法一 github项目页面按键盘上的句号方法二 github项目页面地址栏github com 改为 github dev 方法三 github项目页面地址栏github com 改
信息学奥赛一本通 1176：谁考了第k名

题目链接 http ybt ssoier cn 8088 problem show php pid 1176 include
Operator ‘+‘ cannot be applied to ‘java.lang.String‘, ‘void‘的解决方法

刚开始报下图错是因为我在另一个类中定义有返回值void的方法如图二一个想要调用另一个的方法且是字符串的类型的需要将void换成string 并将输出语句换成return 如图记得最后一行的分号去掉
python循环写入excel中的不同sheet_python实现跨excel的工作表sheet之间的复制方法

python 将test1的Sheet1通过跨文件复制到test2的Sheet2里面包括谷歌没有能搜出这种问题答案我们贴出代码我们加载openpyxl这个包来解决 from openpyxl import load workboo
Java项目数据脱敏常用技术及Jasypt实战

数据脱敏在Java项目中是一项非常重要的任务它可以保护敏感数据同时符合法规和隐私保护要求在本篇博客中我们将介绍数据脱敏的概念以及在Java项目中常用的开源框架和工具的实战应用什么是数据脱敏数据脱敏是指将敏感数据进行处理使其在保
styled-components的配置和使用

在react中正常的给组件引入css文件该css文件会直接作用于全局使用styled components可以有效控制好css作用域 1 安装 yarn add styled components 2 配置并设置全局样式新建一个js
Java实现CNN

Java实现CNN 算法介绍 CNN的优势卷积操作池化操作网络结构训练过程前向传播反向传播代码实现数据模型类Dataset 矩阵尺寸类Size 核心操作类MathUtils Operator OperatorOnTwo接口下
零基础学习Vue: 第21课 Vue 单向数据流父组件的属性值子组件如何更改：

零基础学习Vue 第21课 Vue定义子组件template的常见3种写法单向数据流原理子组件不能直接修改父组件中传递的数据如需间接改变父组件传递的数据解决方法可以在子组件data选项中存储父组件传递的数据之后修改子组件中的数据
解决httpServletRequest.getParameter获取不到参数

用httpServletRequest getParameter接收post请求参数发送端content Type必须设置为application x www form urlencoded 否则会接收不到 RequestMapping
go语言各种hash哈希算法使用汇总（超详细代码）

目录前言一首先以md4为例一 16进制字符串的md4 二字符串的md4 三 16进制字符串字符串封装二 md4 md5 sha1 ripemd160 sha256 sha512 一导包二单个使用三 md4 md5 sh
使用jsoup选择器来查找元素

一用途使用jsoup解析网页抓取手机型号和系统信息二获取方式例子获取终端制造商链接列表 return public List
话题作文汇总

一前言在备考的过程中研读和学习了多篇英语话题作文在此将其记录下来以便加深印象二作文列表 Public Role Model s Rights Internet Kills Conversation Generation Gap
form表单的对象

这个是关于表单表单在HTML中是很重要的一个部分关于表单的使用里面的属性和方法不算很多这里就介绍一下表单的信息用法 document forms 是一个数组包含了文档中所有的表单
Python学习之------retry（异常重试）

在做数据抓取的时候经常遇到由于网络问题导致的程序保存先前只是记录了错误内容并对错误内容进行后期处理原先的流程 def crawl page url pass def log error url pass url try crawl

Python学习之------retry（异常重试）

Python学习之------retry（异常重试） 的相关文章

随机推荐

热门标签

Python学习之------retry（异常重试）的相关文章