Python请求响应403禁止

2023-12-01

所以我想抓取这个网站:https://www.auto24.ee我能够毫无问题地从中抓取数据,但今天它给了我“响应 403”。我尝试使用代理,将更多信息传递给标头,但不幸的是似乎没有任何效果。我在互联网上找不到任何解决方案,我尝试了不同的方法。 之前运行没有任何问题的代码:

import requests

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.93 Safari/537.36',
}

page = requests.get("https://www.auto24.ee/", headers=headers)

print(page)

代码在这里

import requests

headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.93 Safari/537.36'}
page = requests.get("https://www.auto24.ee/", headers=headers)
print(page.text)

总是会得到如下的东西

 <div class="cf-section cf-wrapper">
        <div class="cf-columns two">
          <div class="cf-column">
            <h2 data-translate="why_captcha_headline">Why do I have to complete a CAPTCHA?</h2>

            <p data-translate="why_captcha_detail">Completing the CAPTCHA proves you are a human and gives you temporary access to the web property.</p>
          </div>

          <div class="cf-column">
            <h2 data-translate="resolve_captcha_headline">What can I do to prevent this in the future?</h2>


            <p data-translate="resolve_captcha_antivirus">If you are on a personal connection, like at home, you can 
run an anti-virus scan on your device to make sure it is not infected with malware.</p>

该网站受 CloudFlare 保护。通过标准方式,通过请求或 selenium 等自动化方式访问网站的可能性很小。您看到 403 是因为您的客户端被检测为机器人。可能有一些绕过 CloudFlare 的任意方法可以在其他地方找到,但该网站正在按预期工作。必须通过标头和 cookie 提交大量数据来表明您的请求有效,并且由于您仅提交用户代理,因此会触发 CloudFlare。仅仅欺骗另一个用户代理还不足以不触发验证码,CloudFlare 会检查很多事情。

我建议你看看硒here因为它模拟真实的浏览器,或者研究指南(可能?)通过请求绕过 Cloudflare。

Update找到2个python库cloudscraper和cfscrape。除非您付费购买高级版本,否则这两者都不适用于该网站,因为它使用 cloudflare v2。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Python请求响应403禁止 的相关文章

  • Python、Tkinter、更改标签颜色

    有没有一种简单的方法来更改按钮中文本的颜色 I use button text input text here 更改按下后按钮文本的内容 是否存在类似的颜色变化 button color red Use the foreground设置按钮
  • 如何生成给定范围内的回文数列表?

    假设范围是 1 X 120 这是我尝试过的 gt gt gt def isPalindrome s check if a number is a Palindrome s str s return s s 1 gt gt gt def ge
  • 导入错误:没有名为 _ssl 的模块

    带 Python 2 7 的 Ubuntu Maverick 我不知道如何解决以下导入错误 gt gt gt import ssl Traceback most recent call last File
  • 如何使用 Scrapy 从网站获取所有纯文本?

    我希望在 HTML 呈现后 可以从网站上看到所有文本 我正在使用 Scrapy 框架使用 Python 工作 和xpath body text 我能够获取它 但是带有 HTML 标签 而且我只想要文本 有什么解决办法吗 最简单的选择是ext
  • Python tcl 未正确安装

    我刚刚为 python 安装了graphics py 但是当我尝试运行以下代码时 from graphics import def main win GraphWin My Circle 100 100 c Circle Point 50
  • keras加载模型错误尝试将包含17层的权重文件加载到0层的模型中

    我目前正在使用 keras 开发 vgg16 模型 我用我的一些图层微调 vgg 模型 拟合我的模型 训练 后 我保存我的模型model save name h5 可以毫无问题地保存 但是 当我尝试使用以下命令重新加载模型时load mod
  • 在pyyaml中表示具有相同基类的不同类的实例

    我有一些单元测试集 希望将每个测试运行的结果存储为 YAML 文件以供进一步分析 YAML 格式的转储数据在几个方面满足我的需求 但测试属于不同的套装 结果有不同的父类 这是我所拥有的示例 gt gt gt rz shorthand for
  • Abaqus 将曲面转化为集合

    我一直试图在模型中找到两个表面的中心 参见照片 但未能成功 它们是元素表面 面 查询中没有选项可以查找元素表面的中心 只能查找元素集的中心 找到节点集的中心也很好 但是我的节点集没有出现在工具 gt 查询 gt 质量属性选项中 而且我找不到
  • python 集合可以包含的值的数量是否有限制?

    我正在尝试使用 python 设置作为 mysql 表中 ids 的过滤器 python集存储了所有要过滤的id 现在大约有30000个 这个数字会随着时间的推移慢慢增长 我担心python集的最大容量 它可以包含的元素数量有限制吗 您最大
  • Pandas Dataframe 中 bool 值的条件前向填充

    问题 如何转发 fill boolTruepandas 数据框中的值 如果是当天的第一个条目 True 到一天结束时 请参阅以下示例和所需的输出 Data import pandas as pd import numpy as np df
  • 使用 OpenPyXL 迭代工作表和单元格,并使用包含的字符串更新单元格[重复]

    这个问题在这里已经有答案了 我想使用 OpenPyXL 来搜索工作簿 但我遇到了一些问题 希望有人可以帮助解决 以下是一些障碍 待办事项 我的工作表和单元格数量未知 我想搜索工作簿并将工作表名称放入数组中 我想循环遍历每个数组项并搜索包含特
  • 如何将 numpy.matrix 提高到非整数幂?

    The 运算符为numpy matrix不支持非整数幂 gt gt gt m matrix 1 0 0 5 0 5 gt gt gt m 2 5 TypeError exponent must be an integer 我想要的是 oct
  • 通过数据框与函数进行交互

    如果我有这样的日期框架 氮 EG 00 04 NEG 04 08 NEG 08 12 NEG 12 16 NEG 16 20 NEG 20 24 datum von 2017 10 12 21 69 15 36 0 87 1 42 0 76
  • Python 3 中“map”类型的对象没有 len()

    我在使用 Python 3 时遇到问题 我得到了 Python 2 7 代码 目前我正在尝试更新它 我收到错误 类型错误 map 类型的对象没有 len 在这部分 str len seed candidates 在我像这样初始化它之前 se
  • 为美国东部以外地区的 Cloudwatch 警报发送短信?

    AWS 似乎没有为美国东部以外的 SNS 主题订阅者提供 SMS 作为协议 我想连接我的 CloudWatch 警报并在发生故障时接收短信 但无法将其发送到 SMS YES 经过一番挖掘后 我能够让它发挥作用 它比仅仅选择一个主题或输入闹钟
  • Python:计算字典的重复值

    我有一本字典如下 dictA unit1 test1 alpha unit1 test2 beta unit2 test1 alpha unit2 test2 gamma unit3 test1 delta unit3 test2 gamm
  • 检查所有值是否作为字典中的键存在

    我有一个值列表和一本字典 我想确保列表中的每个值都作为字典中的键存在 目前我正在使用两组来确定字典中是否存在任何值 unmapped set foo set bar keys 有没有更Pythonic的方法来测试这个 感觉有点像黑客 您的方
  • VSCode:调试配置中的 Python 路径无效

    对 Python 和 VSCode 以及 stackoverflow 非常陌生 直到最近 我已经使用了大约 3 个月 一切都很好 当尝试在调试器中运行任何基本的 Python 程序时 弹出窗口The Python path in your
  • Python - 字典和列表相交

    给定以下数据结构 找出这两种数据结构共有的交集键的最有效方法是什么 dict1 2A 3A 4B list1 2A 4B Expected output 2A 4B 如果这也能产生更快的输出 我可以将列表 不是 dict1 组织到任何其他数
  • Pandas 与 Numpy 数据帧

    看这几行代码 df2 df copy df2 1 df 1 df 1 values 1 df2 ix 0 0 我们的教练说我们需要使用 values属性来访问底层的 numpy 数组 否则我们的代码将无法工作 我知道 pandas Data

随机推荐

  • 如何手动设置语料库中的文档ID?

    我正在从数据帧创建 Copus 我将其作为VectorSource因为我只想将一列用作文本源 这可以找到 但是我需要语料库中的文档 ID 来匹配数据帧中的文档 ID 文档 ID 存储在原始数据框中的单独列中 df lt as data fr
  • 增强序列化:前向兼容性因输入流错误而失败

    遵循这个问题 Boost序列化子类我正在尝试支持使用 boost 序列化生成的存档的前向兼容性 但我在使用较旧的代码读取较新的存档时遇到问题 class A public A virtual A default private friend
  • 如何避免 Scala 中类型绑定的重复

    我有一个带有约束类型参数的类 我尝试过identity但返回类型不精确 并且在方法中identityTP 我需要再次指定约束 如何避免使用适用于此类型的方法重复此约束 这是一个例子 sealed trait Location case ob
  • 添加到 window.onload 事件?

    我想知道如何向 window onload 事件添加另一个方法调用 被分配了一个方法调用 假设在脚本的某个地方我有这个作业 window onload function some methods 1 然后稍后在脚本中我有这个作业 windo
  • 在短时间内打开大量连接时的ECONNRESET

    我有这样的情况 我想在猎户座上创建大量实体 我正在将 Orion 和 mongo 的 docker 版本与此 docker compose 一起使用 version 3 services mongo image mongo 3 4 volu
  • 在 XCode 中链接 libuv 库

    有没有人有过在 xcode 中链接 libuv 的经验 我在 git 中创建了一个子模块 以便轻松更新库 但我不太清楚如何正确地将库添加到项目中以允许我包含 uv h 任何帮助我将不胜感激 您可以使用 GYP 为 libuv 生成 xcod
  • 调整 UITableViewCell 框架大小问题

    我正在尝试调整我的大小UITableViewCell s框架通过 cell setFrame CGRectMake cell frame origin x cell frame origin y cell frame size width
  • 为什么unix和Java运行时显示的统计数据存在差异

    我的应用程序遇到一些内存问题 需要帮助理解这些统计数据 Unix top 显示了我的进程的这些统计数据 VSZ 37 4g RSS 20 0g 因此 这意味着 20g 当前已换入进程并正在使用 但是 当我使用运行时类从应用程序中打印统计信息
  • 安装了最新的 JDK 1.8.0,但我的 Javac 版本仍然显示旧版本(Windows 7 - 64)

    我一直在尝试使用 Angular 安装 NativeScripttutorial在过去的两天里 我不断遇到有关 Android SDK 安装不正确和冻结的问题 最后在尝试安装 Android Studio 之前重新安装了最新的 JDK 和
  • “无法在客户端计算机上加载 DLL 'SQLite.Interop.dll' 错误

    我创建了一个 Winforms 应用程序 并将 SQLite 与 Entity Framework 6 结合使用 我使用的是 Visual Studio 2013 该应用程序在我的本地计算机上完美运行 但是 当程序在另一台机器上运行时 会出
  • 对 var2 的更改也会更改 var1,var1 是从该变量派生的

    我正在制作一个 PowerShell 脚本 并遇到了一个奇怪的问题 至少对于我的世界观来说是这样 这是具有 1 个属性和一些整数值的对象 Source Source Priority 43 37 26 51 23 69 6 43 我想创建一
  • ng2-charts条形图不显示数据/图表标签

    我在 angular2 中使用 ng2 charts 构建了水平条形图 但我不确定为什么我没有看到图形数据 也没有在控制台中看到任何错误 HTML
  • 迭代 JSON 对象字符串

    我是一个 JavaScript 菜鸟 在创建 json 字符串后 我有一个由 google gson API 创建的 JSON 字符串 我将其传递给我的 javascript 函数 所以在 javascript 变量中我有一个字符串如下 v
  • 如何创建可在 Windows 7 Phone 和 iPhone 上运行的应用程序?

    很清楚单点触控是解决方案的一部分 因为它允许 C 代码在 iPhone 上运行 然而 Mono Touch 包装了 iPhone API 因此不提供通用 API 另一种选择是一个 jave 脚本工具包 它可以在两者上工作并提供在线数据存储
  • 如何在 IBM Watson 聊天机器人对话中添加新行?

    目前 我正在使用 IBM Watson Coversation api 提供的聊天机器人服务 现在我面临一个问题 与在聊天机器人的文本回复中添加新行有关 谁能告诉我该怎么做 在这种情况下 您可以使用HTML为此 内部对话流程为 br 检查我
  • Unity - 如何从不同的场景获取游戏对象?

    首先 我是一个初学者 所以对我要轻松一些 我正在尝试从另一个场景激活和停用游戏对象 游戏中的玩家 基本上 我试图通过停用当前玩家模型来更改游戏场景中的玩家 并在用户按下商店场景中的某个按钮时激活游戏场景中所需的玩家模型 但我无法访问游戏对象
  • 在已安装程序列表中显示发布者名称

    我使用 Wix Toolset v3 11 生成 msi我的 Windows 应用程序的安装程序 如何让发布者名称出现在我的申请条目中设置 gt 应用程序和功能 I noticed that some entries in that lis
  • dplyr 如何按组落后

    我有一个包含交货时间的订单和应收账款的数据框 我可以使用 dplyr 根据组提前时间填写接收栏吗 df lt data frame team c a a a a a b b b b b order c 2 4 3 5 6 7 8 5 4 5
  • 如何在 JSF 中防止双击

    我们有一些搜索页面需要运行大量数据 并且需要一段时间才能完成 当用户单击搜索按钮时 我们希望不允许他们再次提交搜索结果 在 JSF 中是否有进行 双击 检测 预防的最佳实践 PrimeFaces 组件似乎可以做我们想要的事情 因为它会在单击
  • Python请求响应403禁止

    所以我想抓取这个网站 https www auto24 ee我能够毫无问题地从中抓取数据 但今天它给了我 响应 403 我尝试使用代理 将更多信息传递给标头 但不幸的是似乎没有任何效果 我在互联网上找不到任何解决方案 我尝试了不同的方法 之