Python请求响应403禁止

2023-12-01

所以我想抓取这个网站：https://www.auto24.ee我能够毫无问题地从中抓取数据，但今天它给了我“响应 403”。我尝试使用代理，将更多信息传递给标头，但不幸的是似乎没有任何效果。我在互联网上找不到任何解决方案，我尝试了不同的方法。之前运行没有任何问题的代码：

import requests

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.93 Safari/537.36',
}

page = requests.get("https://www.auto24.ee/", headers=headers)

print(page)

代码在这里

import requests

headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.93 Safari/537.36'}
page = requests.get("https://www.auto24.ee/", headers=headers)
print(page.text)

总是会得到如下的东西

 <div class="cf-section cf-wrapper">
        <div class="cf-columns two">
          <div class="cf-column">
            <h2 data-translate="why_captcha_headline">Why do I have to complete a CAPTCHA?</h2>

            <p data-translate="why_captcha_detail">Completing the CAPTCHA proves you are a human and gives you temporary access to the web property.</p>
          </div>

          <div class="cf-column">
            <h2 data-translate="resolve_captcha_headline">What can I do to prevent this in the future?</h2>


            <p data-translate="resolve_captcha_antivirus">If you are on a personal connection, like at home, you can 
run an anti-virus scan on your device to make sure it is not infected with malware.</p>

该网站受 CloudFlare 保护。通过标准方式，通过请求或 selenium 等自动化方式访问网站的可能性很小。您看到 403 是因为您的客户端被检测为机器人。可能有一些绕过 CloudFlare 的任意方法可以在其他地方找到，但该网站正在按预期工作。必须通过标头和 cookie 提交大量数据来表明您的请求有效，并且由于您仅提交用户代理，因此会触发 CloudFlare。仅仅欺骗另一个用户代理还不足以不触发验证码，CloudFlare 会检查很多事情。

我建议你看看硒here因为它模拟真实的浏览器，或者研究指南（可能？）通过请求绕过 Cloudflare。

Update找到2个python库cloudscraper和cfscrape。除非您付费购买高级版本，否则这两者都不适用于该网站，因为它使用 cloudflare v2。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python请求响应403禁止的相关文章

Python、Tkinter、更改标签颜色

有没有一种简单的方法来更改按钮中文本的颜色 I use button text input text here 更改按下后按钮文本的内容是否存在类似的颜色变化 button color red Use the foreground设置按钮
如何生成给定范围内的回文数列表？

假设范围是 1 X 120 这是我尝试过的 gt gt gt def isPalindrome s check if a number is a Palindrome s str s return s s 1 gt gt gt def ge
导入错误：没有名为 _ssl 的模块

带 Python 2 7 的 Ubuntu Maverick 我不知道如何解决以下导入错误 gt gt gt import ssl Traceback most recent call last File
如何使用 Scrapy 从网站获取所有纯文本？

我希望在 HTML 呈现后可以从网站上看到所有文本我正在使用 Scrapy 框架使用 Python 工作和xpath body text 我能够获取它但是带有 HTML 标签而且我只想要文本有什么解决办法吗最简单的选择是ext
Python tcl 未正确安装

我刚刚为 python 安装了graphics py 但是当我尝试运行以下代码时 from graphics import def main win GraphWin My Circle 100 100 c Circle Point 50
keras加载模型错误尝试将包含17层的权重文件加载到0层的模型中

我目前正在使用 keras 开发 vgg16 模型我用我的一些图层微调 vgg 模型拟合我的模型训练后我保存我的模型model save name h5 可以毫无问题地保存但是当我尝试使用以下命令重新加载模型时load mod
在pyyaml中表示具有相同基类的不同类的实例

我有一些单元测试集希望将每个测试运行的结果存储为 YAML 文件以供进一步分析 YAML 格式的转储数据在几个方面满足我的需求但测试属于不同的套装结果有不同的父类这是我所拥有的示例 gt gt gt rz shorthand for
Abaqus 将曲面转化为集合

我一直试图在模型中找到两个表面的中心参见照片但未能成功它们是元素表面面查询中没有选项可以查找元素表面的中心只能查找元素集的中心找到节点集的中心也很好但是我的节点集没有出现在工具 gt 查询 gt 质量属性选项中而且我找不到
python 集合可以包含的值的数量是否有限制？

我正在尝试使用 python 设置作为 mysql 表中 ids 的过滤器 python集存储了所有要过滤的id 现在大约有30000个这个数字会随着时间的推移慢慢增长我担心python集的最大容量它可以包含的元素数量有限制吗您最大
Pandas Dataframe 中 bool 值的条件前向填充

问题如何转发 fill boolTruepandas 数据框中的值如果是当天的第一个条目 True 到一天结束时请参阅以下示例和所需的输出 Data import pandas as pd import numpy as np df
使用 OpenPyXL 迭代工作表和单元格，并使用包含的字符串更新单元格[重复]

这个问题在这里已经有答案了我想使用 OpenPyXL 来搜索工作簿但我遇到了一些问题希望有人可以帮助解决以下是一些障碍待办事项我的工作表和单元格数量未知我想搜索工作簿并将工作表名称放入数组中我想循环遍历每个数组项并搜索包含特
如何将 numpy.matrix 提高到非整数幂？

The 运算符为numpy matrix不支持非整数幂 gt gt gt m matrix 1 0 0 5 0 5 gt gt gt m 2 5 TypeError exponent must be an integer 我想要的是 oct
通过数据框与函数进行交互

如果我有这样的日期框架氮 EG 00 04 NEG 04 08 NEG 08 12 NEG 12 16 NEG 16 20 NEG 20 24 datum von 2017 10 12 21 69 15 36 0 87 1 42 0 76
Python 3 中“map”类型的对象没有 len()

我在使用 Python 3 时遇到问题我得到了 Python 2 7 代码目前我正在尝试更新它我收到错误类型错误 map 类型的对象没有 len 在这部分 str len seed candidates 在我像这样初始化它之前 se
为美国东部以外地区的 Cloudwatch 警报发送短信？

AWS 似乎没有为美国东部以外的 SNS 主题订阅者提供 SMS 作为协议我想连接我的 CloudWatch 警报并在发生故障时接收短信但无法将其发送到 SMS YES 经过一番挖掘后我能够让它发挥作用它比仅仅选择一个主题或输入闹钟
Python：计算字典的重复值

我有一本字典如下 dictA unit1 test1 alpha unit1 test2 beta unit2 test1 alpha unit2 test2 gamma unit3 test1 delta unit3 test2 gamm
检查所有值是否作为字典中的键存在

我有一个值列表和一本字典我想确保列表中的每个值都作为字典中的键存在目前我正在使用两组来确定字典中是否存在任何值 unmapped set foo set bar keys 有没有更Pythonic的方法来测试这个感觉有点像黑客您的方
VSCode：调试配置中的 Python 路径无效

对 Python 和 VSCode 以及 stackoverflow 非常陌生直到最近我已经使用了大约 3 个月一切都很好当尝试在调试器中运行任何基本的 Python 程序时弹出窗口The Python path in your
Python - 字典和列表相交

给定以下数据结构找出这两种数据结构共有的交集键的最有效方法是什么 dict1 2A 3A 4B list1 2A 4B Expected output 2A 4B 如果这也能产生更快的输出我可以将列表不是 dict1 组织到任何其他数
Pandas 与 Numpy 数据帧

看这几行代码 df2 df copy df2 1 df 1 df 1 values 1 df2 ix 0 0 我们的教练说我们需要使用 values属性来访问底层的 numpy 数组否则我们的代码将无法工作我知道 pandas Data

随机推荐

如何手动设置语料库中的文档ID？

我正在从数据帧创建 Copus 我将其作为VectorSource因为我只想将一列用作文本源这可以找到但是我需要语料库中的文档 ID 来匹配数据帧中的文档 ID 文档 ID 存储在原始数据框中的单独列中 df lt as data fr
增强序列化：前向兼容性因输入流错误而失败

遵循这个问题 Boost序列化子类我正在尝试支持使用 boost 序列化生成的存档的前向兼容性但我在使用较旧的代码读取较新的存档时遇到问题 class A public A virtual A default private friend
如何避免 Scala 中类型绑定的重复

我有一个带有约束类型参数的类我尝试过identity但返回类型不精确并且在方法中identityTP 我需要再次指定约束如何避免使用适用于此类型的方法重复此约束这是一个例子 sealed trait Location case ob
添加到 window.onload 事件？

我想知道如何向 window onload 事件添加另一个方法调用被分配了一个方法调用假设在脚本的某个地方我有这个作业 window onload function some methods 1 然后稍后在脚本中我有这个作业 windo
在短时间内打开大量连接时的ECONNRESET

我有这样的情况我想在猎户座上创建大量实体我正在将 Orion 和 mongo 的 docker 版本与此 docker compose 一起使用 version 3 services mongo image mongo 3 4 volu
在 XCode 中链接 libuv 库

有没有人有过在 xcode 中链接 libuv 的经验我在 git 中创建了一个子模块以便轻松更新库但我不太清楚如何正确地将库添加到项目中以允许我包含 uv h 任何帮助我将不胜感激您可以使用 GYP 为 libuv 生成 xcod
调整 UITableViewCell 框架大小问题

我正在尝试调整我的大小UITableViewCell s框架通过 cell setFrame CGRectMake cell frame origin x cell frame origin y cell frame size width
为什么unix和Java运行时显示的统计数据存在差异

我的应用程序遇到一些内存问题需要帮助理解这些统计数据 Unix top 显示了我的进程的这些统计数据 VSZ 37 4g RSS 20 0g 因此这意味着 20g 当前已换入进程并正在使用但是当我使用运行时类从应用程序中打印统计信息
安装了最新的 JDK 1.8.0，但我的 Javac 版本仍然显示旧版本（Windows 7 - 64）

我一直在尝试使用 Angular 安装 NativeScripttutorial在过去的两天里我不断遇到有关 Android SDK 安装不正确和冻结的问题最后在尝试安装 Android Studio 之前重新安装了最新的 JDK 和
“无法在客户端计算机上加载 DLL 'SQLite.Interop.dll' 错误

我创建了一个 Winforms 应用程序并将 SQLite 与 Entity Framework 6 结合使用我使用的是 Visual Studio 2013 该应用程序在我的本地计算机上完美运行但是当程序在另一台机器上运行时会出
对 var2 的更改也会更改 var1，var1 是从该变量派生的

我正在制作一个 PowerShell 脚本并遇到了一个奇怪的问题至少对于我的世界观来说是这样这是具有 1 个属性和一些整数值的对象 Source Source Priority 43 37 26 51 23 69 6 43 我想创建一
ng2-charts条形图不显示数据/图表标签

我在 angular2 中使用 ng2 charts 构建了水平条形图但我不确定为什么我没有看到图形数据也没有在控制台中看到任何错误 HTML
迭代 JSON 对象字符串

我是一个 JavaScript 菜鸟在创建 json 字符串后我有一个由 google gson API 创建的 JSON 字符串我将其传递给我的 javascript 函数所以在 javascript 变量中我有一个字符串如下 v
如何创建可在 Windows 7 Phone 和 iPhone 上运行的应用程序？

很清楚单点触控是解决方案的一部分因为它允许 C 代码在 iPhone 上运行然而 Mono Touch 包装了 iPhone API 因此不提供通用 API 另一种选择是一个 jave 脚本工具包它可以在两者上工作并提供在线数据存储
如何在 IBM Watson 聊天机器人对话中添加新行？

目前我正在使用 IBM Watson Coversation api 提供的聊天机器人服务现在我面临一个问题与在聊天机器人的文本回复中添加新行有关谁能告诉我该怎么做在这种情况下您可以使用HTML为此内部对话流程为 br 检查我
Unity - 如何从不同的场景获取游戏对象？

首先我是一个初学者所以对我要轻松一些我正在尝试从另一个场景激活和停用游戏对象游戏中的玩家基本上我试图通过停用当前玩家模型来更改游戏场景中的玩家并在用户按下商店场景中的某个按钮时激活游戏场景中所需的玩家模型但我无法访问游戏对象
在已安装程序列表中显示发布者名称

我使用 Wix Toolset v3 11 生成 msi我的 Windows 应用程序的安装程序如何让发布者名称出现在我的申请条目中设置 gt 应用程序和功能 I noticed that some entries in that lis
dplyr 如何按组落后

我有一个包含交货时间的订单和应收账款的数据框我可以使用 dplyr 根据组提前时间填写接收栏吗 df lt data frame team c a a a a a b b b b b order c 2 4 3 5 6 7 8 5 4 5
如何在 JSF 中防止双击

我们有一些搜索页面需要运行大量数据并且需要一段时间才能完成当用户单击搜索按钮时我们希望不允许他们再次提交搜索结果在 JSF 中是否有进行双击检测预防的最佳实践 PrimeFaces 组件似乎可以做我们想要的事情因为它会在单击
Python请求响应403禁止

所以我想抓取这个网站 https www auto24 ee我能够毫无问题地从中抓取数据但今天它给了我响应 403 我尝试使用代理将更多信息传递给标头但不幸的是似乎没有任何效果我在互联网上找不到任何解决方案我尝试了不同的方法之

Python请求响应403禁止

Python请求响应403禁止 的相关文章

随机推荐

热门标签

Python请求响应403禁止的相关文章