如何使用 python 通过 https 下载 pdf 文件

2024-01-30

我正在编写一个 python 脚本，它将根据 URL 中给出的格式在本地保存 pdf 文件。例如。

https://Hostname/saveReport/file_name.pdf   #saves the content in PDF file.

我通过 python 脚本打开这个 URL：

 import webbrowser
 webbrowser.open("https://Hostname/saveReport/file_name.pdf")

该网址包含大量图像和文本。打开此 URL 后，我想使用 python 脚本以 pdf 格式保存文件。

这就是我到目前为止所做的。
Code 1:

import requests
url="https://Hostname/saveReport/file_name.pdf"    #Note: It's https
r = requests.get(url, auth=('usrname', 'password'), verify=False)
file = open("file_name.pdf", 'w')
file.write(r.read())
file.close()

Code 2:

 import urllib2
 import ssl
 url="https://Hostname/saveReport/file_name.pdf"
 context = ssl._create_unverified_context()
 response = urllib2.urlopen(url, context=context)  #How should i pass authorization details here?
 html = response.read()

在上面的代码中我得到： urllib2.HTTPError: HTTP Error 401: Unauthorized

如果我使用代码 2，我如何传递授权详细信息？

我认为这会起作用

import requests
import shutil
url="https://Hostname/saveReport/file_name.pdf"    #Note: It's https
r = requests.get(url, auth=('usrname', 'password'), verify=False,stream=True)
r.raw.decode_content = True
with open("file_name.pdf", 'wb') as f:
        shutil.copyfileobj(r.raw, f)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python27

URL

pdf

pdfgeneration

如何使用 python 通过 https 下载 pdf 文件的相关文章

如何打印没有类型的defaultdict变量？

在下面的代码中 from collections import defaultdict confusion proba dict defaultdict float for i in xrange 10 confusion proba di
如何使用间隙分隔pdf中的段落？

我有一些 pdf 文件每页有 2 3 个段落每个段落都由一些行间隙分隔但是在使用 pymupdf 阅读时我看不到段落之间有任何机器可打印的分隔符还有其他方法吗其他图书馆可以做到这一点吗 code import fitz from
如何使用 Scrapy 从网站获取所有纯文本？

我希望在 HTML 呈现后可以从网站上看到所有文本我正在使用 Scrapy 框架使用 Python 工作和xpath body text 我能够获取它但是带有 HTML 标签而且我只想要文本有什么解决办法吗最简单的选择是ext
打破嵌套循环[重复]

这个问题在这里已经有答案了有没有比抛出异常更简单的方法来打破嵌套循环在Perl https en wikipedia org wiki Perl 您可以为每个循环指定标签并且至少继续一个外循环 for x in range 10 fo
安装后 Anaconda 提示损坏

我刚刚安装张量流GPU创建单独的后环境按照以下指示here https github com antoniosehk keras tensorflow windows installation 但是安装后当我关闭提示窗口并打开新航站楼弹出
从 scikit-learn 导入 make_blobs [重复]

这个问题在这里已经有答案了我收到下一个警告 D Programming Python ML venv lib site packages sklearn utils deprecation py 77 DeprecationWarning
keras加载模型错误尝试将包含17层的权重文件加载到0层的模型中

我目前正在使用 keras 开发 vgg16 模型我用我的一些图层微调 vgg 模型拟合我的模型训练后我保存我的模型model save name h5 可以毫无问题地保存但是当我尝试使用以下命令重新加载模型时load mod
NameError：名称“urllib”未定义”

CODE import networkx as net from urllib request import urlopen def read lj friends g name fetch the friend list from Liv
在pyyaml中表示具有相同基类的不同类的实例

我有一些单元测试集希望将每个测试运行的结果存储为 YAML 文件以供进一步分析 YAML 格式的转储数据在几个方面满足我的需求但测试属于不同的套装结果有不同的父类这是我所拥有的示例 gt gt gt rz shorthand for
Abaqus 将曲面转化为集合

我一直试图在模型中找到两个表面的中心参见照片但未能成功它们是元素表面面查询中没有选项可以查找元素表面的中心只能查找元素集的中心找到节点集的中心也很好但是我的节点集没有出现在工具 gt 查询 gt 质量属性选项中而且我找不到
HTTPS 代理不适用于 Python 的 requests 模块

我对 Python 还很陌生我一直在使用他们的 requests 模块作为 PHP 的 cURL 库的替代品我的代码如下 import requests import json import os import urllib impor
ExpectedFailure 被计为错误而不是通过

我在用着expectedFailure因为有一个我想记录的错误我现在无法修复但想将来再回来解决我的理解expectedFailure是它会将测试计为通过但在摘要中表示预期失败的数量为 x 类似于它如何处理跳过的 tets 但是当我
Numpy 优化

我有一个根据条件分配值的函数我的数据集大小通常在 30 50k 范围内我不确定这是否是使用 numpy 的正确方法但是当数字超过 5k 时它会变得非常慢有没有更好的方法让它更快 import numpy as np N 5000
如何在 Django 中使用并发进程记录到单个文件而不使用独占锁

给定一个在多个服务器上同时执行的 Django 应用程序该应用程序如何记录到单个共享日志文件在网络共享中而不保持该文件以独占模式永久打开当您想要利用日志流时这种情况适用于 Windows Azure 网站上托管的 Django 应
Python：计算字典的重复值

我有一本字典如下 dictA unit1 test1 alpha unit1 test2 beta unit2 test1 alpha unit2 test2 gamma unit3 test1 delta unit3 test2 gamm
设置 torch.gather(...) 调用的结果

我有一个形状为 n x m 的 2D pytorch 张量我想使用索引列表来索引第二个维度可以使用 torch gather 完成然后然后还设置新值到索引的结果 Example data torch tensor 0 1 2 3 4
文本挖掘 pdf 文件/词频问题

我正在尝试挖掘一篇具有丰富 pdf 编码和图表的文章的 pdf 我注意到当我挖掘一些 pdf 文档时我得到的高频词是 phi taeoe toe sigma gamma 等它与某些 pdf 文档配合良好但与其他文档配合使用时却得到这
您可以在 Python 类型注释中指定方差吗？

你能发现下面代码中的错误吗米皮不能 from typing import Dict Any def add items d Dict str Any gt None d foo 5 d Dict str str add items d f
Python：元类属性有时会覆盖类属性？

下面代码的结果让我感到困惑 class MyClass type property def a self return 1 class MyObject object metaclass MyClass a 2 print MyObject
改变字典的哈希函数

按照此question https stackoverflow com questions 37100390 towards understanding dictionaries 我们知道两个不同的字典 dict 1 and dict 2例

随机推荐

Appengine 反向引用 - 需要复合索引吗？

我有一个最近开始抛出的查询 The built in indices are not efficient enough for this query and your data Please add a composite index fo
在 JavaScript 中重写或扩展闭包函数

只是想知道如何覆盖闭包函数的行为例如我怎样才能覆盖baz 下面的代码片段中的函数功能 var foo Hello var bar World function baz return foo bar 如果您在封闭区域之外则无法覆盖baz
getContext() 和 getActivity() 与 FragmentActivity

我需要将 getActivity 和 getContext 方法与 FragmentActivity 一起使用怎样制作呢我无法扩展 Fragment 类我现在不能这样做也许我可以选角或者其他什么需要在这堂课上做 public cl
错误 [HPM] 尝试代理请求 / 从 localhost:8000 到 http://localhost:4000 时发生错误 (ECONNREFUSED)

使用此 Starter 开发 Gatsby 应用程序https github com the road to react with firebase react gatsby firebase authentication https gi
连接到部署在 Kubernetes 中的 SQL Server Docker 容器时，用户 SA 登录失败

我正在关注有关微服务的教程https www youtube com watch v DgVjEo3OGBI https www youtube com watch v DgVjEo3OGBI 有时我使用以下 Yaml 文件在 Kuber
如何在 Excel 2010 for MAC 中安装/使用“Scripting.FileSystemObject”？

我在用Excel for Mac 2011其中 VBA 版本为 14 0 我正在尝试使用此代码来访问文件系统我知道它适用于 Windows Function qfil GetDirectory strDirectoryName As St
如何将列表/集合/数组作为参数值传递给 Apache QueryRunner？

有没有办法执行以下查询 select from table where field in 并传递一个列表集合数组作为值占位符我正在使用 Apache db commons 库中的 QueryRunner 肯定有用创建数组 http
从 android 的 socket.io 发送 JSON 数据

我用过https github com Gottox socket io java client https github com Gottox socket io java client用于android中的socket编程现在我正在接
如何在 OS X El Capitan 上安装 ngrok？

首先我尝试从网站下载 ngrok stable darwin amd64 zip 当我尝试通过终端解压缩时我得到 Archive Users User Downloads ngrok stable darwin amd64 zip En
以编程方式添加数据注释

我正在开发一个正在使用的 asp mvc3 应用程序 NET 4 但是我想使用的模型位于正在使用的类库中 NET 3 5并且无法改变我可以添加 NET 4 数据注释以编程方式更改控制器模型中的某些属性以获得一些简单的验证创建您自己的 M
Kotlin MutableStateFlow.collect 正在删除值

我有一个 Android 应用程序在其中我尝试使用协程流来替换现有的 Otto EventBus 使用我自己的事件总线库 https github com cren90 Kotlin Flow Event Bus 在设置 MutableS
使用pyqt5生成SVG文件

我想使用 pyqt5 使用 Python 绘制一些简单的矢量图像到目前为止我已经成功使用以下代码生成了图像 import sys from PyQt5 QtCore import from PyQt5 QtGui import from
为什么我的图标没有出现在 IE7/8 中？

感兴趣的页面 https www gsb yourbank com test https www gsb yourbank com test ICO 文件 https www gsb yourbank com test favicon ic
C# 问题 - 如何将页面 URL 和 Href 转换为绝对 URL/URI？

如何在 C 中将页面 URL 和 Href 转换为绝对 URL URI 即我正在扫描给定 PageURI 处的网页并且在 HTML 中具有带有 HREF 的链接节点并且希望将此 HREF 转换为有效的绝对 URI 背景请注意我遇到
jquery从iframe内容访问iframe id

我正在尝试用 jquery 做一些事情我有这样的代码 1 html 在2 html文件中我正在尝试访问 iframe 容器 id 2 html文件内容
Java（Android）WebSocket客户端库[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案有一些库可以以不引人注目的方式实现 WebSocket 的使用显然有很多库但我真正寻找的是一个现代的小型库我通常可以在 Andro
jQuery的ajax功能在Android PhoneGap应用程序中不起作用

我想在移动应用程序中通过ajax访问开放API 它在iPhone中工作正常但在Android PhoneGap应用程序中不起作用 returning error gt error message null typeerror Result
如何在 selenium 中使用无头 Chrome 启用 JavaScript

import requests from bs4 import BeautifulSoup from selenium import webdriver from selenium webdriver common keys import
对数深度缓冲器+正交相机

我正在尝试将对数深度缓冲区与正交相机一起使用并遇到一些有趣的结果我在这里构建了一个示例 http jsfiddle net TheJim01 05up96m0 http jsfiddle net TheJim01 05up96m0 左侧
如何使用 python 通过 https 下载 pdf 文件

我正在编写一个 python 脚本它将根据 URL 中给出的格式在本地保存 pdf 文件例如 https Hostname saveReport file name pdf saves the content in PDF file 我

如何使用 python 通过 https 下载 pdf 文件

如何使用 python 通过 https 下载 pdf 文件 的相关文章

随机推荐

热门标签

如何使用 python 通过 https 下载 pdf 文件的相关文章